Livres, périodiques, thèses et manuscrits en réseau. Vers un "web of data" de l'enseignement supérieur ? ABES :: juin 2008
Livres, périodiques, thèses et manuscrits en réseau.
Vers un "web of data" de l'enseignement supérieur ?
ABES :: juin 2008
L’ABES en une image
L’ABES univoque
• Agence Bibliographique de l’Ens. Sup.
• Fondée en 1994
• Pour une mission = un réseau = un outil =
Le Sudoc
• En fait, fusion de trois catalogues» Dès le début, un enjeu d’intégration de données
diverses
L’ABES multipolaire
• De nouveaux catalogues» STAR : thèses électroniques» Calames : archives et manuscrits» Numes : fonds numérisés» Sites de référence : signets» Archives des éditeurs (Elsevier,Springer)
• D’autres projets en perspective» Portail des thèses (suite de STAR)» Ressources pédagogiques (rôle de l’ABES ?)
3 Défis
• Faire interagir nos trois applications majeures (Sudoc, Calames, STAR)
• S’exposer (pour être réutilisé)
• S’enrichir des tiers (réutiliser)
Réponses Web 1.0
• Faire interagir nos trois applications Recherche fédérée z39.50
• S’exposer (pour être réutilisé) Serveur z39.50 Transferts réguliers vers SIGB (FTP)
• S’enrichir des tiers (réutiliser) Hyperliens (856)
Réponses Web 2.0
• Faire interagir nos trois applications Recherche fédérée SRU
• S’exposer (pour être réutilisé) Serveur SRU Serveur OAI-PMH SiteMaps (pour être indexé par les moteurs)
• S’enrichir des tiers (réutiliser) AJAX (Calames : Liber Floridus, Annotations déportées
dans une base ad hoc)
Limites des solutions Web 2.0
• Solutions pas toujours génériques– Solutions de niche souvent, propres au
monde des bibliothèques» SRU» OAI-PMH
– Solutions ad hoc» Lien à Liber Floridus
– Solutions restrictives» RSS (Annotations Calames)
Réponses Web 3.0
• Faire interagir nos trois applications Modèle RDF comme cadre commun Schémas RDF et OWL pour raisonner
• S’exposer (pour être réutilisé) Données RDF/XML et RDFa et SPARQL
• S’enrichir des tiers (réutiliser) Liens intelligents (côté serveur, ou côté
page(AJAX), ou côté navigateur (Operator))
Avantages des promesses du Web 3.0
• Solutions génériques (sortir de la niche…)
• Pas de choix d’un vocabulaire a priori
• Dans l’esprit des bibliothèques (métadonnées structurées et décentralisées, autorités…)
Etapes vers le Web 3.0A explorer
• Modéliser données en RDF (en cours)
• Choix des noms (URI) (en cours)
• Exposition des données : RDFa (en cours), RDF/XML (en cours) et navigation Redirection 303 (en cours)
• Lier à d’autres corpus RDF (sortir de la niche…)• Point d’accès SPARQL• Développer nos propres applications
appuyées sur le modèle RDF
Notice Sudoc en UNIMARCcam0 22 450 001 046394206005 20080411154803.000020 $aUS$b67123162035 $aocm13715745100 $a19860611d1951 u y0engy0103 ba101 1 $afre$cger102 $aFR105 $aa # 000|y200 1 $aProméthée$f[par] Goethe$gtraduction par André Gide, lithographies de Henry Moore210 $a[Paris]$cH. Jonquières$d1950 [i.e. 1951]215 $a64 p.$ccol. ill.$d39 cm300 $a"Il a été tiré de ce livre 183 exemplaires ... soit: 8 exemplaires, numérotés de 1 à 8, comportant une suite des
premiers états & une suite des lithographies définitives ... Il y est joint un dessin original; 10 exemplaires, numérotés de 9 à 18, comportant une suite des lithographies définitives ... 165 exemplaires numérotés de 19 à 183. De plus quelques exemplaires ont été réservés à des collaborateurs"--P. [1]
300 $aIssued in case500 ||$aPrometheus$mFrench680 $aPT1958.P7$bF7700 1$3026895528$aGoethe$bJohann Wolfgang von$f1749-1832$4070702 1$3026890593$aGide$bAndré$f1869-1951702 1$3027036669$aMoore$bHenry$f1898-1986801 3$aFR$bAbes$c20080411$gAFNOR801 1$aUS$bOCLC$gAACR2801 2$aFR$bAUROC$gAFNOR
Notice Sudoc en RDF<frbr:Manif rdf:about="http://www.abes.fr/su/res/122884280"> <dc:title>Prométhée</dc:title> <frbr:realizationOf> <frbr:Work rdf:about="http://www.abes.fr/su/res/123456789"> <dc:title>Prometheus</dc:title> </frbr:Work> </frbr:realizationOf> <dc:creator> <foaf:Person rdf:about="http://www.abes.fr/su/res/026895528"> <foaf:name>Johann Wolfgang von Goethe</foaf:name> </foaf:Person> </dc:creator> </frbr:Manif>
Notice Calames en EAD<c id="D47A15554" level="otherlevel" otherlevel="notice"> <did> <unitid type="cote_actuelle">Ms.2.477</unitid> <unittitle>« Prometheus, » poème dramatique de Goethe</unittitle> <unitdate calendar="gregorian« normal="1701/1800">XVIIIesiècle</unitdate> <langmaterial> <language langcode="ger">allemand</language> </langmaterial> <physdesc> <physfacet type="support">Papier</physfacet> <extent>17 pages</extent> <dimensions unit="mm">227 × 185 mm</dimensions> <physfacet type="reliure">Reliure parchemin</physfacet> </physdesc> </did>
<controlaccess> <persname role="070" authfilenumber="026895528">Goethe</persname> <title role="titre">Prometheus</title> </controlaccess></c>
Notice Calames en RDF<frbr:SingletonManif rdf:about="http://www.calames.abes.fr/pub/ms/res/D47A15554"> <ead:cote>Ms.2.477</ead:cote> <dc:title>« Prometheus, » poème dramatique de Goethe</dc:title> <dc:creator> <foaf:Person rdf:about="http://www.abes.fr/su/res/026895528"> <foaf:name>Goethe</foaf:name> </foaf:Person> </dc:creator> <dc:date>1701/1800</dc:date> <ead:langmaterial>ger</ead:langmaterial> <frbr:realizationOf> <frbr:Work rdf:about="http://www.abes.fr/su/res/123456789"> <dc:title>Prometheus</dc:title> </frbr:Work> </frbr:realizationOf> </frbr:SingletonManif>
Notice de thèse en TEF<mets:mets> <mets:dmdSec ID="a111"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_these"> <mets:xmlData> <tef:thesisRecord> <dc:title xml:lang="de">Goethe-Gedichte in Schuberts Vertonungen</dc:title> <tef:sujetRameau> <tef:vedetteRameauPersonne> <tef:elementdEntree autoriteExterne="026895528" autoriteSource="Sudoc" > Goethe </tef:element*> </tef:vedetteRameauPersonne> </tef:sujetRameau> <dcterms:abstract xml:lang="fr"></dcterms:abstract> <dc:type xsi:type="dcterms:DCMIType">Text</dc:type> <dc:type>Electronic Thesis or Dissertation</dc:type> <dc:language xsi:type="dcterms:RFC3066">FR</dc:language> </tef:thesisRecord> </mets:xmlData> </mets:mdWrap> </mets:dmdSec> <mets:dmdSec ID="xx311"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition"> <mets:xmlData> <tef:edition> <dcterms:medium xsi:type="dcterms:IMT">application/pdf</dcterms:medium>(…)
Notice de thèse en RDF<tef:Thesis rdf:about="http://www.abes.fr/su/res/078464668"> <dc:title>Goethe-Gedichte in Schuberts Vertonungen</dc:title> <dc:subject> <foaf:Person rdf:about="http://www.abes.fr/su/res/026895528"> <foaf:name>Johann Wolfgang von Goethe</foaf:name> </foaf:Person> </dc:subject> <dc:creator> <foaf:Person rdf:about="http://www.abes.fr/su/res/07846465X"> <foaf:name>Astrid Tschense</foaf:name> </foaf:Person> </dc:creator> </tef:Thesis>
Relier nos trois corpusDésormais, ils appartiennent au même monde
• Convergence car :• Même modèle RDF• Vocabulaires communs
» Dublin Core» FOAF» FRBR» SKOS
• Nommages des ressources via les mêmes autorités Sudoc
» http://www.abes.fr/su/res/026895528 (Goethe)
Linked ABES ;-)
Requêtes transversales à travers les trois corpus
• Donne-moi tous les documents concernant Goethe (qq soit rôle)
• Donne-moi les noms des directeurs de thèse portant sur des correspondants de Goethe
• Donne-moi les ouvrages portant sur les abbayes qui furent propriétaires des ms illuminés par telle personne
Au-delà des corpus ABES
• Connecter nos corpus à d’autres corpus universitaires
– Ressources pédagogiques– Archives ouvertes/institutionnelles
• Connexion facilitée par la réutilisation des autorités Sudoc hors ABES
– Autorités Sudoc comme web service (lecture, écriture)
Linked Ens. Sup.
Au-delà des corpus Ens. Sup.
• Connecter nos corpus à d’autres corpus français
– Gallica– Archives de France
• Via les autorités < http://www.abes.fr/su/res/026895528 >
<owl:sameAs> <http://catalogue.bnf.fr/ark:/12148/ca11905269w/resource>
?
Some Linked French Data
Au-delà des corpus Français
• Passer à l’échelle globale< http://www.abes.fr/su/res/026895528 >
owl:sameAs
< http://dbpedia.org/resource/Johann_Wolfgang_von_Goethe>
• Exploiter dans nos requêtes les infos de DBpedia
<skos:subject rdf:resource="http://dbpedia.org/resource/Category:German_travel_writers"/>
Sortir des frontières
Web of data par capillarité ?
• Commencer chez soi aussi• Puis avec ses voisins
– Intra-abes– Archives institutionnelles, ressources pédagogiques– BnF, archives de France– …
• Avec un modèle décentralisé !• Paradoxe : c’est en exploitant les possibilités
d’interopérabilité globale (Web) qu’on peut mieux communiquer localement
S’exposer en RDFa
• Calames bientôt
• Comment ?• XSLT mis à jour
• Pourquoi ?• Exploitations via
» Yahoo SearchMonkey» Plugins comme Operator» …
• Apprendre en faisant
<div class="unitdate">
<span class="controlC">Date : </span>
<span content="1601/1700" property="dc:date" class="unitdate">XVII<sup>e</sup> siècle</span>
</div>
<http://www.calames.abes.fr/pub/ms/res/MAZB10378> <dc:date> "1601/1700"
Conclusion
• Avancer pas à pas• Risque faible• Humilité nécessaire• Faire et laisser faire
• Enjeux techniques• Stocker en relationnel, exploiter en RDF ?• Les performances
• Enjeux intellectuels• Comment nommer nos ressources (URI) ?• Description fine et spécifique (FRBR, propriétés de niche) ou
minimale (DC simple)• Comme se lier à d’autres ressources ?
ABES
www.abes.fr
Yann Nicolas
(Dép. Etudes et Projets)
n i c o l a s @ a b e s . f r