YOU ARE DOWNLOADING DOCUMENT

Please tick the box to continue:

Transcript
Page 1: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

theses.fr

un exemple d'ouverture de l'information scientifique

sur le web de données

mediadix :: 12 octobre 2012

Page 2: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 3: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 4: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 5: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 6: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 7: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 8: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Les identifiants, marchepied vers le web de données

• 2011LYO20079 N° national de thèse• http://www.theses.fr/2011LYO20079• http://www.theses.fr/2011LYO20079/document• http://www.theses.fr/2011LYO20079.rdf

• 030807069 Autorité Sudoc (IdRef)• http://www.theses.fr/030807069• http://www.theses.fr/030807069.rdf

Page 9: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Les données ABES sur le web de données, avec IdRef pour pivot

IdRef =

autorités Sudoc

Page 10: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Le nuage du web de données liées

Page 11: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Le nuage du web de données liées

Page 12: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Sindice,agrégateur RDF,en sait autant sur theses.fr que theses.fr !

Page 13: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Comment faire pour récupérer le RDF de theses.fr

• Moissonnage– OAI-PMH– Sitemaps + RDF

• Dump– Extraction de tout le RDF– Asynchrone (photo au temps t)– Celui qui a récupéré le dump a toute liberté• Ex : monter un serveur SPARQL et une appli dessus

@todo

Page 14: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Adopte un directeur de thèse

Requête fine avec SPARQL :

Je veux un directeur, qui a déjà dirigé une thèse sur la colonisation dans les 5 ans, qui n’encadre pas plus de 4 étudiants, qui est relié à tel vieux prof…

Et encore plus de possibilités, via les liens RDF vers IdRef, Sudoc, Wikipedia…

Page 15: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

MAIS CE N’EST PAS SI SIMPLE…

Page 16: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FOURNIR D’AUTRES MOYENS D’EXPLOITER LES DONNÉES

Les technologies sémantiques, c’est pas magique

Page 17: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Fournir d’autres moyens d’exploiter les données

• OAI-PMH (pour thèses élec. Soutenues)• Notices Sudoc (!)

• Web services de recherche :

http://www.theses.fr/?q=colonialisme+allemagne

http://www.theses.fr/?q=colonialisme+allemagne&format=atom

http://www.theses.fr/?q=colonialisme+allemagne&format=solr

Page 18: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Echange de données

≠Ouverture des données

theses.fr en RDF

Page 19: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

L’INTEROPÉRABILITÉ, UN DILEMME

Les technologies sémantiques, c’est pas magique

Page 20: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 21: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Lever le dilemme de l’interopérabilité ?

marcrel:aut dcterms:creator

MARCREL = MARC 21 Relators(codes de fonction)

Dublin Core

« plus fin mais un truc de bib » « tout le monde comprend mais un peu vague »

marcrel:aut rdfs:subPropertyOf dcterms:creator

Ce mécanisme logique lève le dilemme.Sur le papier…

Page 22: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

AVANT D’OUVRIR LES DONNÉES,IL FAUT LES PRODUIRE

Les technologies sémantiques, c’est pas magique

Page 23: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Derrière les données,des workflows, des réseaux, des gens

• STEP – Réseau des thèses en préparation– Ex-FCT (Nanterre)– 80 établissements

• STAR– Réseau des thèses numériques – 80 établissements

• Circulation des données– Saisie en ligne– Imports (partiels ou complets)

• Interconnexion avec IdRef– Utiliser et enrichir le référentiel d’autorités, avec outils IdRef– Automatiser le liage aux autorités ? Mais il faut encore qu’elles existent

Page 24: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

POUR SE LIER A D’AUTRES DONNÉES, IL FAUT QU’ELLES SOIENT OUVERTES !

Les technologies sémantiques, c’est pas magique

Page 25: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FondsCalames

Auteur IdRef

LivreSudoc

Thèsetheses.fr

AuteurVIAF

AuteurBnF

AuteurWikipedia

AuteurISNI

Aujourd’hui

owl:sameAs

owl:sameAs

Page 26: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FondsCalames

Auteur IdRef

LivreSudoc

Thèsetheses.fr

AuteurVIAF

AuteurBnF

AuteurWikipedia

AuteurISNI

Demain

owl:sameAs

Page 27: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FondsCalames

Auteur IdRef

LivreSudoc

Thèsetheses.fr

AuteurVIAF

AuteurBnF

AuteurWikipedia

AuteurISNI

Après-demain peut-être ?

owl:sameAs

owl:sameAs

AuteurHAL CCSD

ArticleHAL CCSD

LivreWorldcat

cite

a pourdérivé

owl:sameAs

Donnéesbrutes

+ brevets, projets ANR, etc.

+ CrossRef, revues, indicateurs d’usage, etc.

+ articles, éditions scientifiques, numérisation, etc.

Page 28: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Les services publics de données qui manquent aux thèses à l’IST

• Structures de recherche• Écoles doctorales• Entreprises (SIREN de l’INSEE)• Brevets (?)• Classification des disciplines• Projets de recherche• …

Vers un système d’information de la recherche, mais pas monolithique

Page 29: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Leibniz, Lettre à Arnauld (30 avril 1687)

29


Related Documents