SemWebPro 18/01/2011 1 Publier des données liées sur le Web Tutoriel Datalift Bernard Point – Atos Origin [email protected]François Scharffe – LIRMM/CNRS [email protected]Raphaël Troncy – Eurecom [email protected]Bernard Vatant – Mondeca [email protected]Avec l'aide de l'équipe de Datalift et le soutien de l'Agence Nationale de la Recherche
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
SemWebPro 18012011 1
Publier des donneacutees lieacutees sur le WebTutoriel Datalift
Bernard Point ndash Atos Originbernardpointatosorigincom
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 31 Introduction
SemWebPro 18012011 4
Datalift
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 4
Datalift
Une expeacuterimentation agrave grande eacutechelle de la publication de donneacutees sur le Web
Objectifs - Publier des donneacutees de reacutefeacuterence - Automatiser le processus de
publication - Deacutemontrer linteacuterecirct de publier ses
donneacutees
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 5
Datalift
Deux pheacutenomegravenes Socieacutetal ndash louverture des donneacutees Technique ndash le web seacutemantique
La reacutevolution des donneacutees est en marche Le web de donneacutees explose comme le web de documents a exploseacute agrave la fin des anneacutees 90
SemWebPro 18012011 6
Datalift
Activiteacutes Publication de jeux de donneacutees Recherche de nouvelles techniques et formalismes
pour ameacuteliorer et automatiser la publication Deacuteveloppement dune architecture modulaire
permettant dinteacutegrer des outils daide agrave la publication Organisation deacutevegravenements autour de la publication
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 13
Vous avez dit laquo vocabulaire raquo
hellip Et pourquoi pas laquo ontologie raquo Ou laquo scheacutema raquo ou laquo scheacutema de (meacuteta)donneacutees raquo Ou laquo modegravele raquo (de donneacutees du monde)
Toutes ces appellations sont utiliseacutees et justifiables Ce sont en tout cas des laquo vocabulaires raquo Deacutefinissant des types drsquoobjets (ou classes)
et les proprieacuteteacutes (ou attributs) lieacutes agrave ces types drsquoobjets Types et attributs sont deacutefinis logiquement
et nommeacutes en langage naturel
Un vocabulaire (seacutemantique) est une formalisation explicitede concepts existant dans le langage naturel
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 14
Les vocabulaires pour les donneacutees lieacutees
Sont destineacutes agrave deacutecrire des ressources en RDFSrsquoappuient sur un des langages standard du W3C RDF Schema (RDFS)
bull pour des vocabulaires sans logique trop complexe OWL
bull pour des constructions logiques plus complexes
Ces deux langages sont compatibles A quelques deacutetails pregraves (peu significatifs dans ce cadre)
Peuvent ecirctre composeacutes laquo ad libitum raquo On peut reacuteutiliser quelques eacuteleacutements drsquoun vocabulaire A condition de respecter la seacutemantique originelle
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 15
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire utile est un vocabulaire utiliseacute Les donneacutees publieacutees sur CKAN
donnent une ideacutee de lrsquoutilisation des vocabulaires
Exemple httpckannettagformat-foafliste les datasets utilisant FOAF httpxmlnscomfoaf01
Autres critegraveres drsquoutilisabiliteacute Simpliciteacute et lisibiliteacute en langage naturel
Documentation des eacuteleacutements (deacutefinitions en langage naturel) Visibiliteacute et peacuterenniteacute de la publication
Flexibiliteacute et extensibiliteacute
Inteacutegration seacutemantique (avec drsquoautres vocabulaires) Inteacutegration sociale (avec la communauteacute des utilisateurs)
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 16
Un vocabulaire crsquoest aussi une communauteacute
Mauvaise (mais freacutequente) pratique Faire un vocabulaire dans son coin
bull Par exemple comme projet de recherchebull Sans srsquoappuyer sur aucun vocabulaire existant
Le publier (ou pas) et lrsquooublier Ne pas se preacuteoccuper de ses utilisateurs
Un bon vocabulaire a une vie organique Des utilisateurs et des cas drsquoutilisation Des reacutevisions et des extensions Comme un vocabulaire laquo naturel raquo
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 17
Types de vocabulaires
Vocabulaires de meacutetadonneacutees Permettent drsquoannoter les autres vocabulaires
bull Dublin Core Vann cc REL Status
Vocabulaires de reacutefeacuterence Fournissent des classes et proprieacuteteacutes laquo communes raquo
bull FOAF Event Time Org Ontology
Vocabulaires de domaine Speacutecifiques agrave un domaine de connaissance
bull Geonames Music Ontology WildLife Ontology
Vocabulaires laquo geacuteneacuteraux raquo Deacutecrivent laquo tout raquo agrave un niveau arbirtaire de deacutetail
bull DBpedia Ontology Cyc Ontology SUMO
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 18
Vocabulaires de meacutetadonneacutees
Permettent drsquoannoter les vocabulaires Infos sur le vocabulaire entier Infos sur chacun des eacuteleacutements (classe ou proprieacuteteacute)
Exemples Dublin Core Elements Dublin Core Terms VANN CC Rel SKOS (label properties)
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 19
Vocabulaires de reacutefeacuterence
Deacutefinissent des classes laquo communes raquo Personne Document Lieu Eveacutenement hellip
Et des proprieacuteteacutes tout aussi communes nom adresse date auteur membre hellip
Exemples FOAF DCMI Type Organization Ontology Event Ontology
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 20
Vocabulaires de domaine
Concernent un domaine de connaissance ou un meacutetier particulier
Conditions de reacuteusabiliteacute dimension laquo raisonnable raquo Ontologies trop complexes et trop fines difficiles agrave reacuteutiliser Construction modulaire agrave privileacutegier cœur et extensions
Exemples Music Ontology Programme Ontology Description Of A Project WildLife Ontology Metalex Ontologies bio-meacutedicales
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 21
Vocabulaires laquo geacuteneacuteralistes raquo
Ont pour ambition de tout deacutecrire agrave un niveau arbitraire de deacutetail SUMO Cyc DBpedia
Difficilement reacuteutilisables Difficiles agrave explorer laquo Bon agrave tout bon agrave rien raquo
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 22
Le Trio Gagnant
Dublin Core Terms Prototype du vocabulaire de meacutetadonneacutees
FOAF Prototype du vocabulaire laquo commun raquo
SKOS Un langage drsquoannotation et de repreacutesentation des concepts
Pratiquement 80 des publications de donneacutees lieacuteespeuvent reacuteutiliser ces vocabulaires
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 23
Dublin Core
Au deacutepart un scheacutema de meacutetadonneacutees simple DC elements compte 15 proprieacuteteacutes Valeurs = simple texte
Etendu et preacuteciseacute comme une ontologie DC Terms compte 22 classes et 55 proprieacuteteacutes DC Type deacutefinit des grandes classes de ressources
A reacuteutiliser systeacutematiquement
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 24
Friend of a Friend (FOAF)
Creacuteeacute en 2000 par Dan Brickley et Libby MilllerVocabulaire simple et geacuteneacuterique destineacute
agrave deacutecrire des personnes et leur activiteacute en ligne 13 classes 62 proprieacuteteacutes
Mis agrave jour reacuteguliegraverement Evolue par dialogue avec la communauteacute
Fortement reacuteutiliseacute par drsquoautres vocabulaires Soit pour deacutecrire des meacutetadonneacutees Soit pour eacutetendre des classe et proprieacuteteacutes
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 25
Exemples drsquoutilisation de FOAF
Dans les meacutetadonneacutees de vocabulaire Description de lrsquoauteur ou de lrsquoeacutediteur drsquoun vocabulaire En combinaison avec Dublin Core
Comme racine pour des classes ou proprieacuteteacutes plus speacutecialiseacutees Devrait ecirctre plus utiliseacute encore Trop de vocabulaires reacuteinventent la classe laquo Personne raquo
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 26
SKOS
Un vocabulaire meacutetier pour les theacutesaurus Deacutefinition de laquo scheacutemas de concepts raquo Relations seacutemantiques entre concepts
Un vocabulaire de meacutetadonneacutees skosprefLabel skosaltLabel hellip Compleacutementaire de Dublin Core
Extensible pour des types de noms ou des relations seacutemantiques plus fines
INCONTOURNABLE
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 27
Liaison entre vocabulaires
Neacutecessite le dialogue entre les gestionnairesdes vocabulaires (auteurs eacutediteurs) et utilisateurs Exemple 1 proprieacuteteacutes eacutequivalentes dans FOAF et Dublin Core
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 28
Bonnes (et moins bonnes) pratiques
Music OntologyProgrammes OntologyGeospeciesTaxonConcept
Exploration des ontologies hellip
Et aussi moins bonnes pratiques Exemple DBpedia ontology
bull Limite de la deacutemarche totalement laquo bottom up raquo
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 29
Vocabulary of a Friend
httpwwwmondecacomfoafvoafUn vocabulaire simple hellipPour repreacutesenter lrsquointerconnexion des vocabulairesUn point drsquoentreacutee unique aux vocabulaires et datasets
du Linked Data CloudTravail en cours dans le cadre de Datalift
Navigation
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 303 Conversion
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 31
Les 4 Principes des Donneacutees Lieacutees
Tim Berners Lee [2006] (Design Issues)
1 Utiliser des URIs pour identifier des choses(nrsquoimporte quelle chose et pas seulement des documents)
2 Utiliser des URIs HTTP ndash qui fournissent des identifiants uniques et distribueacutes agrave lrsquoeacutechelle du monde ndash de telle maniegravere que les ces URIs renvoient de lrsquoinformation
3 Fournir de lrsquoinformation laquo utile raquo en RDF quand on deacutereacutefeacuterence lrsquoURI
4 Inclure dans les descriptions RDF des liens vers drsquoautres ressources pour permettre la deacutecouverte drsquoinformation lieacutee (laquo fureter raquo)
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Publier des Donneacutees 5 eacutetoiles
SemWebPro 18012011 32
httpwwww3orgDesignIssuesLinkedDatahtml
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Publier des Donneacutees 5 eacutetoiles
Mettre vos donneacutees sur le web (dans nrsquoimporte quel format) hellip et penser agrave expliciter la licence
Mettre vos donneacutees dans un format structureacute (ex une feuille Excel plutocirct qursquoune image scanneacutee drsquoun tableau)
Preacutefeacuterer un format non-proprieacutetaire (ex csv plutocirct que Excel)
Utiliser des URLs pour identifier les choses pour que drsquoautres personnes puissent pointer vers vos donneacutees
Lier vos donneacutees avec drsquoautres donneacutees pour mieux contextualiser vos donneacutees
SemWebPro 18012011 33
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
URL Design et URL Pattern
Guide des bonnes pratiques pour les donneacutees lieacutees La ressource httpdbpediaorgresourceParis Le document httpdbpediaorgpageParis Les donneacutees httpdbpediaorgdataParis
hellip le tout servi avec de la neacutegociation de contenu (voir partie suivante)
SemWebPro 18012011 34
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
URL Design et URL Pattern
Cas drsquoeacutetude legislationgovuk Lrsquoidentifiant httpwwwlegislationgovukidukpga198567 Le document httpwwwlegislationgovukukpga198567 La repreacutesentation (en XML plutocirct que HTML)
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
URI Pattern dans REST
Les services REST (Representational State Transfer) manipulent des ressources et les URLs sont principalement utiliseacutes pour adresser ces ressources
Une URI de base httpwwwexamplecombookstore
Une ressource agrave un URL unique (retrieve update create delete) httpwwwexamplecombookstorebooksISBN123
Notion de collection (list replace create delete) httpwwwexamplecombookstorebooks
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Toutes les URIs sont deacutereacutefeacuterenccedilables
40SemWebPro 18012011
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Et en France
LrsquoINSEE a publieacute des donneacutees en RDF il y a deacutejagrave 5 ans La France httprdfinseefrgeo2010PAYS_FR Une reacutegion httprdfinseefrgeo2010REG_01 Un deacutepartement httprdfinseefrgeo2010DEP_971 Un arrondissement httprdfinseefrgeo2010ARR_651 Un canton httprdfinseefrgeo2010CAN_6520 Une commune httprdfinseefrgeo2010COM_65045
SemWebPro 18012011 41
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Un peu drsquoexplications
Les URIs sont assez expliciteshttprdfinseefrgeo2010COM_65045 Autoriteacute inseefr Domaine geo Type de ressource COM REG Identifiant local inclut le numeacutero
Les URIs sont versionneacutees URIs multiples pour la mecircme ressource car il y a tregraves peu
drsquoeacutevolution dans une anneacutee et les eacutevolutions importantes conduisent agrave des changements de codes
Les URIs ne sont PAS deacutereacutefenccedilablesSemWebPro 18012011 42
Et si crsquoeacutetait agrave refaire
On choisira plutocirct httpgeoinseefrcommune65045 httpgeoinseefrregion01 ou httpgeoinseefrreacutegion01 (IRI)
Et des collections httpgeoinseefrcommune httpgeoinseefrcommunes
SemWebPro 18012011 43
Outils de conversion vers RDF
Comment sont les donneacutees agrave convertir Base de donneacutees Formats (semi-)structureacutes Accegraves programmatique (API)
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Conversion et Publication
SemWebPro 18012011 49
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Triplify Relational data to JSONRDF
Extraire un dossier dans votre application webhttpsourceforgenetprojectstriplify
Modifier un fichier de configuration Requecircte SQL hellip URI pattern PHP lover
SemWebPro 18012011 50
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Triplify Relational data to JSONRDF
Impose des contraintes sur les donneacutees 1egravere colonne doit ecirctre une cleacute primaire pour la geacuteneacuteration
drsquoURI Nom des colonnes utiliseacute pour nommer les proprieacuteteacutes oblige
agrave renommer les colonnes pour utiliser les ontologies du web de donneacutees
SemWebPro 18012011 51
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Deacutefinit une transformation standard drsquoune table relationnelle en RDF le scheacutema relationnel est utiliseacute
bull les cellules drsquoune ligne produisent des triplets avec un sujet communbull les noms des colonnes deacutefinissent les preacutedicatsbull chaque cellule produit un objets
les diffeacuterentes tables drsquoune mecircme base de donneacutees sont aussi lieacutees entre elles
R2RML Base de donneacutees vers RDF
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH52SemWebPro 18012011
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Exemple
SemWebPro 18012011 53
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Exemple
SemWebPro 18012011 54
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Exemple
SemWebPro 18012011 55
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Exemple
SemWebPro 18012011 56
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 57
Premiegravere eacutetape transformation de la table des personnes
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
P_Table rdftype rrTriplesMap rrsubjectMap [
rrtermtype BlankNode rrcolumn ID
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate aname
]rrobjectMap [
rrcolumn Name ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ahomepage
]rrobjectMap [
rrcolumn Homepage rrtermtype IRI
] ] Creacutedits Ivan Herman
httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 58
Deuxiegraveme eacutetape transformation de la table des livres
ISBN Author Title Year0006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
B_Table rdftype rrTriplesMap rrsubjectMap [
rrtemplate httpisbnISBN ]rrpredicateObjectMap [
rrpredicateMap [rrpredicate atitle
]rrobjectMap [
rrcolumn Title ]
] rrpredicateObjectMap [
rrpredicateMap [rrpredicate ayear
]rrobjectMap [
rrcolumn Year ]
] Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 59
httphellipisbn000651409X
Ghosh Amitav httpwwwamitavghoshcom
The Glass Palace
2000
anameahomepage
aauthor
Troisiegraveme eacutetape lier les deux tables entre elles
ISBN Author Title 70006511409X id_xyz The Glass Palace 2000
ID Name Homepageid_xyz Ghosh Amitav httpwwwamitavghoshcom
B_Table a rrTriplesMap rrrefPredicateObjectMap [
rrrefPredicateMap [rrpredicate aauthor
]rrrefObjectMap [
rrparentTriplesMap P_Table rrjoinCondition
childAuthor = parentID ]
] ]
Creacutedits Ivan Herman httpwwww3org2011Talks0117-Paris-IH
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Travailler sur des spreadsheets
SemWebPro 18012011 60
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Google acquiert Freebase
SemWebPro 18012011 61
httpcodegooglecompgoogle-refine
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Extension RDF agrave Google Refine
SemWebPro 18012011 62
Un projet du DERI pour ajouter une interface graphique agrave Google Refine permettant drsquoexporter ses donneacutees nettoyeacutees en RDFhttplablinkeddataderiie2010grefine-rdf-extension
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Conversion en RDF souhaiteacutee
lthttplablinkeddataderiietest0gt a foafPerson foafname Stephan Wilcke foaftitle Chief Executive Officeren foafmember lthttplablinkeddataderiietestorganizationsasset-protection-agencygt lthttplablinkeddataderiietestannualPayRategt pound150000 - pound154999
lthttplablinkeddataderiietestorganizationsasset-protection-agencygt a foafOrganization foafname Asset Protection Agencyen
SemWebPro 18012011 63
Name Job Title Grade Organization
Annual pay rate - including
taxable benefits and allowances
Notes
Stephan Wilcke Chief Executive Officer
Asset Protection Agency
pound150000 -pound154999
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Google Refine et RDF
SemWebPro 18012011 64
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Google Refine et RDF
SemWebPro 18012011 65
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Google Refine et RDF
SemWebPro 18012011 66
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
Publish My Data
SemWebPro 18012011 67
httppublishmydatacom
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 684 Publication
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 69
La publication RDF Store
Les Composants
Le stockage des donneacutees sans scheacutema dans les RDF Store
Identification de Graphe
Les Infeacuterences
SPARQL
Le deacutereacutefeacuterencement
Neacutegociation de contenu
Meacutethode et analyse des produits RDF Store
Les Mises agrave jour
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 70
Les Composants de la publication
Point drsquoentreacuteeSPARQL
REST
StockageRDF
Alimentation
Alimentation
Alimentation
MoteurDrsquoinfeacuterences
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
Quelques produits Virtuoso Sesame Mulgara 4storeOWLIM AllegroGraph Big DataJena
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 71
Un RDF Store est sans scheacutema applicatif
Dans un RDF Store il nrsquoy a pas de scheacutemas de base applicatif comme dans un SGBDR
Lrsquointerface entre les couches applicatives et donneacutees est donc plus franche
Un seul RDF Store va pouvoir stocker toutes les donneacutees (uplifteacutees)
Inversement il nrsquoy a pas de veacuterification par rapport agrave un scheacutema (RDFS OWL) ou de veacuterification de contraintes applicatives
Gain en souplesse Alimentation
Alimentation
Alimentation
123
4
56
78
91110
14
1213
1516
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 72
RDF Store La notion de Graphe
Un triplet est drsquoune granulariteacute tregraves fineBesoin drsquoune granulariteacute supeacuterieure qui rassemble un
ensemble de triplet un graph Les triplets laquo ccedila nrsquoexiste pas raquo Vive le quad On passe de (Sujet Preacutedicat Objet) agrave (Sujet Preacutedicat Objet
Identification de graphe)
Le Graphe est un rassemblement applicatif de triplets
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 73
RDF Store Les Graphes Nommeacutes
1
23
4
5
6
7
8
9
1110
14
12
13
15
16
Opeacuteration de destruction sur un graphe
Porteacutee transactionnelleRequecirctes SPARQL
peuvent restreindre le peacuterimegravetre agrave des Graphes
A deacutefinir au moment de la conception des applications
Le Graphe est un rassemblement applicatif de tripletsPas de cloisonnements de ressources entre Graphes
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 74
RDF Store Les Infeacuterences
Geacuteneacuterer des triplets agrave partir drsquoautres triplets
Meacutecanisme de deacuteduction Les hommes sont mortels Socrate est un homme donc
Socrate est mortel Bernard est un informaticien les informaticiens sont des
humains donc
Evite drsquoecirctre exhaustif permet de beacuteneacuteficier de lrsquoheacuteritage et ou des eacutequivalences des ontologies
Drsquoautant plus inteacuteressant quand on relie nos donneacutees avec des donneacutees externes
Promesse de levier du Web Seacutemantique
1
23
4
5
6
78
9
1110
14
12
13
1516
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 75
RDF Store SPARQL
SPARQL est le SPARQL Protocol And RDF Query Langage crsquoest un protocole un langage drsquointerrogation un format de reacutesultats
Variantes SPARQL 10 SPARUL (update) SPARQL 11
Point drsquoentreacuteeSPARQL
InterrogationRequecirctes
Sparql
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 76
RDF Store Deacutereacutefeacuterencement
Notion drsquoidentifiants URI
Les identifiants opaques Drsquoentiteacutes de cleacutes de contextehellip
Une URI non deacutereacutefeacuterenccedilable infoatosoriginDataliftDAG
Mais alors comment lier les donneacutees
En utilisant les identifiants (URI) comme des adresses (URL) ce qui est la notion mecircme de deacutereacutefeacuterencement
Une URI deacutereacutefeacuterenccedilable Un identifiant DBpedia Retourne la page descriptive du cineacuteaste David Lynch
httpdbpediaorgresourceDavid_Lynch
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 77
Exemples de Deacutereacutefeacuterencement
Les URI peuvent ecirctre directement deacutereacutefeacuterenccedilables par construction
Ou indirectement deacutereacutefeacuterenccedilables applicativement
Une URI deacutereacutefeacuterenccedilable applicativement Livre les fleurs du mal de Beaudelaire eacutediteacute agrave Alenccedilon en 1857 par
Poulet-Malassis et de Broise accessible sur Gallica (httpgallicabnff)
Lrsquoidentifiant de ce livre (norme ark) ark12148bpt6k70861t La page de deacutedicace de ces fleurs maladive agrave Theacuteophile Gautier (page 6)
ark12148bpt6k70861tf6
Cette page est accessible sur Gallica httpgallicabnffrark12148bpt6k70861tf6
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 78
RDF Store neacutegociation de contenu
Meacutecanisme qui permet au client de speacutecifier le type de reacuteponse attendue (liste de mime types)
Ce qui permet agrave la fois agrave des navigateurs web et des applications consommant nativement du RDF drsquoutiliser la mecircme URI (agrave condition qursquoelle soit deacutereacutefeacuterenccedilable)
La mecircme URI est utiliseacutee pour laquo servir raquo des humains et des applications
REST Navigation
HTMLRDF
applicationrdf+xml texthtml
Analyse des RDF Store la meacutethode QSOS
Qualification and Selection of Open Source Software
Projet Open Source sur des solutions open source
httpwwwqsosorg
Objectifs de QSOS
Qualifier des logiciels
Comparer des solutions apregraves avoir deacutefini des exigences et en pondeacuterant les critegraveres
Seacutelectionner le produit le plus adapteacute par rapport agrave un besoin
QSOS fournit
Une meacutethode objective et formaliseacutee
Un reacutefeacuterentiel drsquoeacutetudes disponibles
Des outils facilitant le deacuteroulement de la meacutethode
79SemWebPro 18012011
SemWebPro 18012011 80
Analyse des RDF StoreDeacutefinition des critegraveres
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Fonctionnaliteacutes importexport SPARQL Endpoint Stockage des donneacutees Accegraves aux donneacutees Infeacuterences Transactions Clustering Replication Seacutecuriteacute API
PerformancesVolumeacutetrie Chargementextraction de triplets requecircte simple et
complexe avec et sans infeacuterence
Les reacutesultats complets seront publieacutes (Datalift qsos)
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 81
RDF Store Un extrait des eacutevaluations
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 82
RDF Store La Mise agrave Jour
Pas plus de gestion de version native en RDF qursquoen SGBDR
On a la faciliteacute des Graphes Identifieacutes Le problegraveme est repousseacute en dehors du RDF StoreApproche par gestion de version applicative des objets
(avec cycle de vie) ou approche par annule amp remplaceAttention aux identifiants agrave retrouver Par construction Par recherche
Sur les URI des triplets de lrsquoobjet Sur lrsquoidentifiant du Graphe
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 83
Architecture drsquoalimentation exemple de Datalift
SPARQLEnd Point
REST
RDF depublication module
module
module
1
23
4
5
6
78
9
1110
14
12
13
1516
InterrogationNavigation
RDF depreacuteparation
SPARQLEnd Point
1
23
4
5
6
78
9
111012
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 845 Interconnexion
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 85
Web de donneacutees et interconnexions
Sans liens point de web mais des silos de donneacuteesPlusieurs types de liens les arecirctes du graphe formeacute
par le web de donneacutees sont eacutetiqueteacuteesCertains liens sont formeacutes lors de la phase de
seacutelection jeux de donneacutees de reacutefeacuterenceNous eacutetudierons ici un type de lien preacutecis les liens
deacutequivalence
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 86
owlsameAs
indique une identiteacute logique entre deux ressources la qualiteacute des liens disponibles nest pas toujours au
rendez-vous
Autres types de liens owldifferentFrom rdfsseeAlso
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 87
Comment interconnecter ses donneacutees
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 88
Comment interconnecter ses donneacutees
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 89
Comment interconnecter ses donneacutees
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 90
Comment interconnecter ses donneacutees
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 91
Comment interconnecter ses donneacutees
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 92
Les outils critegraveres danalyse
Degreacute dautomaticiteacute
Loutil est-il complegravetement automatique (boite noire) Loutil a-til besoin decirctre parameacutetreacute par lutilisateur Quel type de paramegravetres
Techniques dalignement utiliseacutees
Alignement de chaicircnes de caractegraveres Fonctions externes Propagation de similariteacute
Autres techniques
Domaine loutil est-il speacutecifique agrave un certain domaine
SemWebPro 18012011 93
Les outils critegraveres danalyse
Ontologies
Loutil prend-il en compte les ontologies associeacutees aux donneacutees
Loutil permet-il daligner des jeux de donneacutees deacutecrits en fonction dontologies diffeacuterentes
Dans le cas ougrave elles sont diffeacuterentes loutil aligne-t-il les ontologies
Sortie Quest-ce que loutil produit en sortie (liens owlsameAs autre types de liens) Loutil propose-t-il de fusionner deux jeux de donneacutees
Jeux de donneacutees comment loutil accegravede-t-il aux donneacutees
Loutil effectue-t-il des traitements post-opeacuteratoire
SemWebPro 18012011 94
Les outils
RKB-CRS Service de reacutesolution de co-reacutefeacuterence de la base de connaissances RKB
LD-mapper Outil de liage pour lontologie de la musique
ODD Linker Outil de liage baseacute sur le langage SQL
RDF-AI Outil de liage et fusion de jeux de donneacutees
Silk et Silk LSL Outil de liage et language de specification de liens
Knofuss architecture Outil de liage et fusion de jeux de donneacutees
SemWebPro 18012011 95
Les outils
SemWebPro 18012011 96
Exemple de speacutecification pour SilkltSilkgtltPrefix id=rdfs namespace=
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 97
Ou trouver des liens
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies
Linked Data Lite | the Web on Steroids 10 (iPhone)
Des applications mobiles
SemWebPro 18012011 113
Linked Data Lite | the Web on Steroids 10 (iPhone)
ASBOrometer
SemWebPro 18012011 114
Chercher un dentiste pregraves de chez vous
SemWebPro 18012011 115
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 116
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 117
Publier des donneacutees lieacutees sur le Web Tutoriel Datalift
Sommaire
Slide Number 3
Datalift
Datalift
Datalift
Datalift
Processus de publication
Processus de publication
Sommaire
Slide Number 11
Les vocabulaires de mes amis hellip
Vous avez dit laquo vocabulaire raquo
Les vocabulaires pour les donneacutees lieacutees
Qursquoest-ce qursquoun bon vocabulaire
Un vocabulaire crsquoest aussi une communauteacute
Types de vocabulaires
Vocabulaires de meacutetadonneacutees
Vocabulaires de reacutefeacuterence
Vocabulaires de domaine
Vocabulaires laquo geacuteneacuteralistes raquo
Le Trio Gagnant
Dublin Core
Friend of a Friend (FOAF)
Exemples drsquoutilisation de FOAF
SKOS
Liaison entre vocabulaires
Bonnes (et moins bonnes) pratiques
Vocabulary of a Friend
Slide Number 30
Les 4 Principes des Donneacutees Lieacutees
Publier des Donneacutees 5 eacutetoiles
Publier des Donneacutees 5 eacutetoiles
URL Design et URL Pattern
URL Design et URL Pattern
Un peu drsquoabstraction
Quid des autres secteurs
URI Pattern dans REST
Repreacutesenter des eacuteveacutenements en LODE
Choisir des URIs pour les dimensions
Et en France
Un peu drsquoexplications
Et si crsquoeacutetait agrave refaire
Outils de conversion vers RDF
D2R Database to RDF mapping
D2RQ Map
D2RQ Map (preacuteambule)
D2RQ Map (creacuteation de tables)
Conversion et Publication
Triplify Relational data to JSONRDF
Triplify Relational data to JSONRDF
R2RML Base de donneacutees vers RDF
Exemple
Exemple
Exemple
Exemple
Premiegravere eacutetape transformation de la table des personnes
Deuxiegraveme eacutetape transformation de la table des livres
Troisiegraveme eacutetape lier les deux tables entre elles
Travailler sur des spreadsheets
Google acquiert Freebase
Extension RDF agrave Google Refine
Conversion en RDF souhaiteacutee
Google Refine et RDF
Google Refine et RDF
Google Refine et RDF
Publish My Data
Slide Number 68
La publication RDF Store
Les Composants de la publication
Un RDF Store est sans scheacutema applicatif
RDF Store La notion de Graphe
RDF Store Les Graphes Nommeacutes
RDF Store Les Infeacuterences
RDF Store SPARQL
RDF Store Deacutereacutefeacuterencement
Exemples de Deacutereacutefeacuterencement
RDF Store neacutegociation de contenu
Analyse des RDF Store la meacutethode QSOS
Analyse des RDF Store Deacutefinition des critegraveres
RDF Store Un extrait des eacutevaluations
RDF Store La Mise agrave Jour
Architecture drsquoalimentation exemple de Datalift
Slide Number 84
Web de donneacutees et interconnexions
owlsameAs
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Comment interconnecter ses donneacutees
Les outils critegraveres danalyse
Les outils critegraveres danalyse
Les outils
Les outils
Exemple de speacutecification pour Silk
Ou trouver des liens
Vers linterconnexion automatique
Slide Number 99
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
Visualiser vos donneacutees
VisiNav
Sigma
Slide Number 108
Nos Deacuteputeacutes FR
Quelques exemples ameacutericains
Quelques exemples ameacutericains
Des applications mobiles
Des applications mobiles
ASBOrometer
Chercher un dentiste pregraves de chez vous
Mashups hellip Mashups hellip Mashups hellip
Mashups hellip Mashups hellip Mashups hellip
SemWebPro 18012011 98
Vers linterconnexion automatique
Nous avons vu que certains champs de la speacutecification de liens pourraient ecirctre eacuteviteacutes Utilisation des alignements entre les ontologies Deacutetection des proprieacuteteacutes identifiantes Indication des meacutethodes de comparaison agrave utiliser gracircce agrave
des meacutetadonneacutees attacheacutees aux ontologies