Top Banner
theses.fr un exemple d'ouverture de l'information scientifique sur le web de données mediadix :: 12 octobre 2
29

theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Aug 20, 2015

Download

Education

Y. Nicolas
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

theses.fr

un exemple d'ouverture de l'information scientifique

sur le web de données

mediadix :: 12 octobre 2012

Page 2: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 3: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 4: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 5: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 6: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 7: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 8: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Les identifiants, marchepied vers le web de données

• 2011LYO20079 N° national de thèse• http://www.theses.fr/2011LYO20079• http://www.theses.fr/2011LYO20079/document• http://www.theses.fr/2011LYO20079.rdf

• 030807069 Autorité Sudoc (IdRef)• http://www.theses.fr/030807069• http://www.theses.fr/030807069.rdf

Page 9: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Les données ABES sur le web de données, avec IdRef pour pivot

IdRef =

autorités Sudoc

Page 10: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Le nuage du web de données liées

Page 11: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Le nuage du web de données liées

Page 12: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Sindice,agrégateur RDF,en sait autant sur theses.fr que theses.fr !

Page 13: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Comment faire pour récupérer le RDF de theses.fr

• Moissonnage– OAI-PMH– Sitemaps + RDF

• Dump– Extraction de tout le RDF– Asynchrone (photo au temps t)– Celui qui a récupéré le dump a toute liberté• Ex : monter un serveur SPARQL et une appli dessus

@todo

Page 14: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Adopte un directeur de thèse

Requête fine avec SPARQL :

Je veux un directeur, qui a déjà dirigé une thèse sur la colonisation dans les 5 ans, qui n’encadre pas plus de 4 étudiants, qui est relié à tel vieux prof…

Et encore plus de possibilités, via les liens RDF vers IdRef, Sudoc, Wikipedia…

Page 15: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

MAIS CE N’EST PAS SI SIMPLE…

Page 16: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FOURNIR D’AUTRES MOYENS D’EXPLOITER LES DONNÉES

Les technologies sémantiques, c’est pas magique

Page 17: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Fournir d’autres moyens d’exploiter les données

• OAI-PMH (pour thèses élec. Soutenues)• Notices Sudoc (!)

• Web services de recherche :

http://www.theses.fr/?q=colonialisme+allemagne

http://www.theses.fr/?q=colonialisme+allemagne&format=atom

http://www.theses.fr/?q=colonialisme+allemagne&format=solr

Page 18: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Echange de données

≠Ouverture des données

theses.fr en RDF

Page 19: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

L’INTEROPÉRABILITÉ, UN DILEMME

Les technologies sémantiques, c’est pas magique

Page 20: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données
Page 21: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Lever le dilemme de l’interopérabilité ?

marcrel:aut dcterms:creator

MARCREL = MARC 21 Relators(codes de fonction)

Dublin Core

« plus fin mais un truc de bib » « tout le monde comprend mais un peu vague »

marcrel:aut rdfs:subPropertyOf dcterms:creator

Ce mécanisme logique lève le dilemme.Sur le papier…

Page 22: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

AVANT D’OUVRIR LES DONNÉES,IL FAUT LES PRODUIRE

Les technologies sémantiques, c’est pas magique

Page 23: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Derrière les données,des workflows, des réseaux, des gens

• STEP – Réseau des thèses en préparation– Ex-FCT (Nanterre)– 80 établissements

• STAR– Réseau des thèses numériques – 80 établissements

• Circulation des données– Saisie en ligne– Imports (partiels ou complets)

• Interconnexion avec IdRef– Utiliser et enrichir le référentiel d’autorités, avec outils IdRef– Automatiser le liage aux autorités ? Mais il faut encore qu’elles existent

Page 24: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

POUR SE LIER A D’AUTRES DONNÉES, IL FAUT QU’ELLES SOIENT OUVERTES !

Les technologies sémantiques, c’est pas magique

Page 25: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FondsCalames

Auteur IdRef

LivreSudoc

Thèsetheses.fr

AuteurVIAF

AuteurBnF

AuteurWikipedia

AuteurISNI

Aujourd’hui

owl:sameAs

owl:sameAs

Page 26: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FondsCalames

Auteur IdRef

LivreSudoc

Thèsetheses.fr

AuteurVIAF

AuteurBnF

AuteurWikipedia

AuteurISNI

Demain

owl:sameAs

Page 27: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

FondsCalames

Auteur IdRef

LivreSudoc

Thèsetheses.fr

AuteurVIAF

AuteurBnF

AuteurWikipedia

AuteurISNI

Après-demain peut-être ?

owl:sameAs

owl:sameAs

AuteurHAL CCSD

ArticleHAL CCSD

LivreWorldcat

cite

a pourdérivé

owl:sameAs

Donnéesbrutes

+ brevets, projets ANR, etc.

+ CrossRef, revues, indicateurs d’usage, etc.

+ articles, éditions scientifiques, numérisation, etc.

Page 28: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Les services publics de données qui manquent aux thèses à l’IST

• Structures de recherche• Écoles doctorales• Entreprises (SIREN de l’INSEE)• Brevets (?)• Classification des disciplines• Projets de recherche• …

Vers un système d’information de la recherche, mais pas monolithique

Page 29: theses.fr : un exemple d'ouverture de l'information scientifique sur le web de données

Leibniz, Lettre à Arnauld (30 avril 1687)

29