13/05/2005 Emmanuelle Bermès 1 Les métadonnées à la Bibliothèque nationale de France Une vue d’ensemble Emmanuelle Bermès - [email protected] Bibliothèque nationale de France Département de la bibliothèque numérique
Jan 13, 2016
13/05/2005 Emmanuelle Bermès 1
Les métadonnées à la Bibliothèque nationale de France
Les métadonnées à la Bibliothèque nationale de France
Une vue d’ensemble
Emmanuelle Bermès - [email protected]èque nationale de France
Département de la bibliothèque numérique
13/05/2005 Emmanuelle Bermès 2
IntroductionMétadonnées : essai de définition
Décrire, représenterRôle des métadonnées descriptivesL’identificationRôle des métadonnées de structure
Préserver, administrerDifférents types de métadonnées de préservationLumière sur la gestion des droitsMETS : un format global
Partager, diffuserLes métadonnées transformées : les interfaces, l’indexationUn protocole d’échange : l’OAI
Conclusion
PLANPLAN
13/05/2005 Emmanuelle Bermès 3
Métadonnées : essai de définition (1)Métadonnées : essai de définition (1)
Des données sur les données ...qui servent à organiser la connaissance et à
utiliser et exploiter le documentinternes ou externes
descriptives, contextuelles et structurelles
initiales et ajoutées tout au long du cycle de vie
qui servent à le maintenir accessible dans le temps et à garantir et contrôler cet accèsadministratives et techniques
initiales et ajoutées tout au long du cycle de vie
NB : certaines métadonnées sont communes aux deux types.
13/05/2005 Emmanuelle Bermès 4
Métadonnées : essai de définition (2)Métadonnées : essai de définition (2)
les métadonnées ne s’appliquent pas à une donnée mais à un ensemble de données signifiant
les métadonnées sont parfois comprises parmi les données de l’ensemble de données signifiant, parfois extérieures à lui
les métadonnées sont des données, soumises aux même défis de production, gestion, conservation que les données elles-mêmes...
13/05/2005 Emmanuelle Bermès 5
Métadonnées : essai de définition (3)Métadonnées : essai de définition (3)
La gestion d’un objet numérique complexe implique : une gestion complexe du descriptif (une ou plusieurs
notices, descriptions à niveaux)une gestion complexe des aspects techniques (s’il y a
différents formats de fichier par ex.)une gestion complexe des aspects administratifs (droits,
suivi des évolutions du document, suivi des évolutions des métadonnées)
une gestion complexe de sa structure physique (organisation des fichiers entre eux)
une gestion complexe de sa structure logique (organisation des parties du contenu entre elles)
C’est le rôle des métadonnées.
13/05/2005 Emmanuelle Bermès 6
Métadonnées : essai de définition (4)Métadonnées : essai de définition (4)
?
Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux
Métadonnées descriptives
•rattacher le document à l’original / différentes versions d’un document
•donner accès à la copie numérique / électronique
Métadonnées administratives
•gérer la collection, c’est-à-dire
•gérer les droits d’accès
•préserver les informations techniques nécessaires à la lecture des fichiers
•garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
identifiant unique (localisation / identification)
Métadonnées de structure
•rattacher les fichiers entre eux
•reconstituer la structure du document
13/05/2005 Emmanuelle Bermès 7
IntroductionMétadonnées : essai de définition
Décrire, représenterRôle des métadonnées descriptivesL’identificationRôle des métadonnées de structure
Préserver, administrerDifférents types de métadonnées de préservationLumière sur la gestion des droitsMETS : un format global
Partager, diffuserLes métadonnées transformées : les interfaces, l’indexationUn protocole d’échange : l’OAI
Conclusion
PLANPLAN
13/05/2005 Emmanuelle Bermès 8
Décrire, représenterDécrire, représenter
Les métadonnées descriptives : appréhender le contenu d’un objet
description bibliographique approfondie et détaillée
identifier un objet ou un groupe d’objetsdescription bibliographique minimale
identifiant pérenne
identifier les parties qui composent un objetinformation de structure
échanger des objets ou des descriptions d’objetsdescription bibliographique dans un format normalisé
13/05/2005 Emmanuelle Bermès 9
Le rôle des métadonnées descriptives (1)Le rôle des métadonnées descriptives (1)
Dans le modèle OAIS : Information d’identification
Identification interne
Identification Globale
description de la ressource
Donne le moyen d’identifier le document
URL
ISBN
Cote d'origine
ID du fichier
Auteur
Titre
13/05/2005 Emmanuelle Bermès 10
Le rôle des métadonnées descriptives (2)Le rôle des métadonnées descriptives (2)
Une tradition dans les bibliothèquesLe catalogage : création d’information descriptive secondaire
(notice) qui caractérise une information primaire (document)Les métadonnées : des données (secondaires) sur les données
(primaires)
Caractéristiques du catalogage : un contenu normalisé : ISBD, AACR...Un format pour le traitement informatique : MARC (Machine
readable cataloguing)une notice bibliographique c’est…
une description d’un objet matérieldes « points d’accès » pour retrouver le documentune localisation pour se le procurer
13/05/2005 Emmanuelle Bermès 11
Le rôle des métadonnées descriptives (3)Le rôle des métadonnées descriptives (3)
Du catalogage aux métadonnées les métadonnées
une description d’un objet matériel ou non, les métadonnées peuvent être dans le document lui-même
multiplication des « points d’accès », information structuréeune localisation : URL / URN / URI
De nouveaux formatspour les notices : Dublin Core, EAD + formats dérivés de
MARC en XML (MarcXML, MODS, BiblioML)nouveau : pour le contenu des documents eux-mêmes
autrefois on n’entrait pas « dans » le documentnouveaux besoins : OCR, tables des matières en saisie…nouveau formats : TEI
13/05/2005 Emmanuelle Bermès 12
L’identification (1)L’identification (1)
Problématique : passer d’un nom de fichier à une URIobjectifs
de citabilité (pour les utilisateurs d ’une ressource)
d’identification (pour les machines chargées de localiser une ressource sur un réseau)
fonctionnalités des identifiants (URN) :unicité - pérennité - granularité - adaptabilité -
extensibilité - indépendance - résolution
13/05/2005 Emmanuelle Bermès 13
L’identification (2)L’identification (2)
Les systèmes d’identification existants et normalisés sur le plan international :
systèmes non spécifiques au Web : ISBN...spécifications du W3C : URI, URN, URLsystèmes de nommage du monde de l’édition
électronique : Handle, DOIsystèmes de redirection : PURL, POIsystèmes indépendants : ARK
les propriétés de ARKspécificité : le « qualifier »
13/05/2005 Emmanuelle Bermès 14
Le rôle des métadonnées de structure (1)Le rôle des métadonnées de structure (1)
Les métadonnées de structure : connaître tous les fichiers qui composent un
documenty compris les fichiers de différents formats (texte / image)y compris les fichiers de différentes natures (versions)
connaître la relation physique entre ces fichiersordre d’affichage fichier cible qui donne accès à l’ensemble ...
connaître la relation logique entre ces fichiersdélimitation de chapitres, de sériesdétail du contenu d’un fichier ...
13/05/2005 Emmanuelle Bermès 15
Le rôle des métadonnées de structure (2)Le rôle des métadonnées de structure (2)
Collection Document(notice
bibliographique)Volume, tome,
fascicule... Page
Un document complexe peut avoir plusieurs niveaux d’accès ou niveaux de granularité
Document simple : pas de problème de structure en soi, mais peut tout de même avoir plusieurs niveaux d’accès
Vue de détail
(article)
Vue de détail
Image(légende)
Lot(notice
bibliographique)
Collection
13/05/2005 Emmanuelle Bermès 16
Le rôle des métadonnées de structure (4)Le rôle des métadonnées de structure (4)
Grouped'Objets
Objet
Fichier
PériodiqueSérie Monogr. à Plusieurs Vol. (MPV) Document Multimédia multi-support (MMS)
Vue de détail (fichier image)Fichier texte Fichier vidéoFichier audioImage (d'une planche de diapo, d'un fichier html)
PageFichier htmlFace d'un disque
VolumeFasciculeCassette, disque, disque vinyle, planche de diapos, disquette,
Ensemble
Arborescence à gérer :
13/05/2005 Emmanuelle Bermès 17
IntroductionMétadonnées : essai de définition
Décrire, représenterRôle des métadonnées descriptivesL’identificationRôle des métadonnées de structure
Préserver, administrerDifférents types de métadonnées de préservationLumière sur la gestion des droitsMETS : un format global
Partager, diffuserLes métadonnées transformées : les interfaces, l’indexationUn protocole d’échange : l’OAI
Conclusion
PLANPLAN
13/05/2005 Emmanuelle Bermès 18
Préserver, administrerPréserver, administrer
Les métadonnées administratives : métadonnées techniques
pour la conservation (migration, émulation)pour la restitution (pour savoir comment visualiser ce qu’on a
conservé)
métadonnées de gestion des droitspour contrôler l’accès (droits d’auteur, confidentialité)pour contrôler l’usage (un fois qu’on a accédé au document, droit
de l’imprimer, le copier, le modifier…)
métadonnées de source et de provenancepour faire le lien avec un document source / original, analogique ou
nonpour conserver l’historique des modifications subies par l’objet
numérique
13/05/2005 Emmanuelle Bermès 19
Métadonnées de préservation (1)Métadonnées de préservation (1)
Matériel Système
d'exploitation CompilateurInterpréteur
Format Application
Microprocesseur
Multimedia
Périphérique
Nom
Version
Nom
Version
Instruction
Nom
Version
Nom
Version
Dans le modèle OAIS : Information de Représentation
13/05/2005 Emmanuelle Bermès 20
Métadonnées de préservation (2)Métadonnées de préservation (2)
Exemples de métadonnées techniques extraites automatiquement au niveau du fichier
caractéristiques techniques communes : File path File name and extension Former file name File size File date and time MIME type File format File format version Target indicator
caractéristiques techniques particulières :
Image (récupérées à partir des en-têtes TIFF)
Audio Video Texte Base de données Fichiers systèmes (exécutables)
13/05/2005 Emmanuelle Bermès 21
Gestion des droits (1)Gestion des droits (1)
Les droits de propriété intellectuellele droit moralle droit patrimonial
droit de reproductiondroit de représentationautres : droits voisins, propriété industrielle
Conséquences pour le document numérique / électroniquesur la diffusion au publicsur la reproduction à des fins de conservation
13/05/2005 Emmanuelle Bermès 22
Gestion des droits (2)Gestion des droits (2)
Droits d’usage et droit d’accèsun contexte d’utilisation
quel type d’utilisateur ?quelle application ?
des permissions : trouver, voir, imprimer, copier, modifier, détruire
des contraintes : qualité, quantité, prix...
13/05/2005 Emmanuelle Bermès 23
Gestion des droits (3)Gestion des droits (3)Gestion des droits
• Rights Declaration– Rights category– Other category type– Rights beginning date– Application duration– Rights end date – Rights contractref– Contract Type– Origin
• Users Rights - Context (Utilisateurs concernés par la déclaration des droits)
– User type
• Rights Holder – RightsHolder Name– RightsHolder Dates– RightsHolder Responsibility – Authority Record Reference – RightsHolder Comments – RightsHolder Contact
– Permissions– Constraints
13/05/2005 Emmanuelle Bermès 24
METS : un format global (1)METS : un format global (1)
Metadata Encoding and Transmission Standard (METS)
implémentation du modèle de référence OAIS (Open Archival Information System)
schéma XML défini pour permettre la création d’un fichier de métadonnéescontenant la description de la structure hiérarchique d’objets
numériques constituant une ressource numérique répertoriant les noms et la localisation des fichiers
correspondant à ces objetscontenant toutes les métadonnées associées
descriptivesadministratives (technique - source - droits - provenance)
13/05/2005 Emmanuelle Bermès 25
METS : un format global (2)METS : un format global (2)
Conserver : METS permet de regrouper dans un seul fichier
toutes les métadonnées d’un documentdes pointeurs vers des métadonnées qui décrivent le
document et sont stockées ailleurs éventuellement, les fichiers qui composent le document
Il réserve une place particulière aux métadonnées techniques et administratives, essentielles pour la conservation à long terme du document numérique
Il préserve l’intégrité des documents complexes grâce à une carte de structure
13/05/2005 Emmanuelle Bermès 26
METS : un format global (3)METS : un format global (3)
Donner accèsgrâce à un système élaboré de pointeurs, METS
permet de relier entre eux les différents fichiers qui constituent un document, et de relier les métadonnées avec les fichiers qu’elles décrivent
grâce à la carte de structure, METS permet de reconstruire la navigation dans le document, qu’elle soit linéaire ou logique
METS est un schéma XML ; il est donc possible d’utiliser les technologies XML standard pour réaliser une interface de consultation à partir d’un fichier METS.
13/05/2005 Emmanuelle Bermès 27
METS : un format global (4)METS : un format global (4)
EchangerMETS est un standard ouvert basé sur XMLS’appuyant sur des outils de collaboration (liste de
discussion, exemples, METS implementation registry, partage d’outils…)
De plus en plus adopté notamment dans les bibliothèques
pour faciliter l’intéropérabilité, il s’appuie sur les METS application profiles
13/05/2005 Emmanuelle Bermès 28
METS : un format global (5)METS : un format global (5)
7 sections : Header : informations sur le document METSDescriptive metadata Section : métadonnées descriptives
externes ou encapsuléesAdministrative metadata Section : métadonnées techniques,
droit, source, provenanceFile section : liste des fichiers composant l’objetStructural map : carte de structure, peut être logique ou
physique, répétableStructural links : liens entre différents éléments de la carte de
structureBehavior : association d’exécutables
13/05/2005 Emmanuelle Bermès 29
METS : un format global (6)METS : un format global (6)
Les blocs de métadonnées de METS sont
des « capsules », des enveloppes videsqu’on remplit avec un lien (pointeur) vers autre chose
qu’on remplit avec des données dans un autre format
Les formats complémentaires : principaux formats XML de métadonnées
tout document en XML ou encodé en base 64
les schémas d’extension
13/05/2005 Emmanuelle Bermès 30
METS : un format global (7)METS : un format global (7)
Le système de pointeurs : Mdref + xlink : permet de pointer vers un bloc de métadonnées
stocké autre part
DMDID, AMDID : on utilise des identifiants, appliqués à chaque
bloc de métadonnées, pour relier les blocs entre eux
fptr : file pointer, permet de pointer vers l’identifiant d’un fichier
tel qu’on l’a donné dans la fileSec
mptr : pointeur externe vers un autre fichier METS, permet
d’articuler plusieurs documents METS entre eux
area : élément de la carte de structure qui permet de pointer
non vers un fichier, mais vers une partie d’un fichier
13/05/2005 Emmanuelle Bermès 31
METS : un format global (8)METS : un format global (8)
AMDID
fptr
Mdref
mptr
DMDID
Les relations entre les blocs de métadonnées :
area
13/05/2005 Emmanuelle Bermès 32
IntroductionMétadonnées : essai de définition
Décrire, représenterRôle des métadonnées descriptivesL’identificationRôle des métadonnées de structure
Préserver, administrerDifférents types de métadonnées de préservationLumière sur la gestion des droitsMETS : un format global
Partager, diffuserLes métadonnées transformées : les interfaces, l’indexationUn protocole d’échange : l’OAI
Conclusion
PLANPLAN
13/05/2005 Emmanuelle Bermès 33
Les interfaces et l’indexation (1)Les interfaces et l’indexation (1)
Les métadonnées descriptives servent à... Trouver :
dans le catalogue de bibliothèqueadapté pour la recherche avancéeaccès intégré à l’offre de la bibliothèque
(numérique/analogique : bibliothèque hybride)
avec un moteur de rechercherecherche simple conforme aux habitudes du webrecherche fine (mots-notice, tables et index en mode texte)recherche plein texte (au-delà des seules métadonnées
descriptives)
13/05/2005 Emmanuelle Bermès 34
Les interfaces et l’indexation (2)Les interfaces et l’indexation (2)
Les métadonnées descriptives servent à... Indexer :
Les moteurs de recherche les utilisent pour indexer les documents
veiller àl’accessibilité des donnéesleur structurationleur pérennité (identifiants)
13/05/2005 Emmanuelle Bermès 35
Les interfaces et l’indexation (3)Les interfaces et l’indexation (3)
Les métadonnées descriptives servent à... Découvrir : l’accès intuitif
la navigation par listesliste d ’auteursliste de titres
l’utilisation des classifications (Dewey)par époquespar types de documentspar thèmes
… vers les classifications « à facettes » ?
13/05/2005 Emmanuelle Bermès 36
Les interfaces et l’indexation (4)Les interfaces et l’indexation (4)
Les métadonnées de structure servent à...se repérer dans un document complexeavoir une vue d’ensemble du contenuaccéder à un niveau de granularité plus fin
Quelques pistes : la pagination (carte de structure physique)la table des matières (carte de structure
logique)les vignettes
13/05/2005 Emmanuelle Bermès 37
Un protocole d’échange : l’OAI (1)Un protocole d’échange : l’OAI (1)
Plusieurs objectifs :mettre en place des collections numériques partagées
en France : les pôles associésavec des bibliothèques étrangères (projets thématiques)
améliorer la visibilité des ressources de la BnF sur le Webdans des portails documentaires (Sudoc)à travers des SP généralistes (OAIster)à travers les moteurs de recherche (Yahoo)
améliorer la cohérence de l’offre de ressources numériques de la BnF en interne
utilisation de l’OAI pour créer un moteur de recherche fédéré sur l’ensemble des ressources
voir ex. de la BN d’Australie http://www.nla.gov.au
13/05/2005 Emmanuelle Bermès 38
Un protocole d’échange : l’OAI (2)Un protocole d’échange : l’OAI (2)
Un protocole simple et ouvert :utilise des technologies ouvertes qui sont des
standards reconnus sur le Webprotocole HTTPlangage XML
offre une grande liberté d’applicationindépendant des logiciels et des plateformesdéveloppement simple et rapide ou approfondi et
complexeet une grande simplicité de mise en œuvre
pas de modification des structures existantes, ce n’est qu’une « couche » rajoutée au dessus de l’architecture de l’archive
13/05/2005 Emmanuelle Bermès 39
Un protocole d’échange : l’OAI (3)Un protocole d’échange : l’OAI (3)
Un protocole largement répandu ...dans les archives ouvertes,
dans les institutions patrimoniales et culturelles
dans le domaine de la recherche d’information sur le Webmoteurs de recherche (Yahoo, Google)
portails documentaires (OAIster, ARC, portails de bibliothèques)
13/05/2005 Emmanuelle Bermès 40
Un protocole d’échange : l’OAI (4)Un protocole d’échange : l’OAI (4)
Un protocole qui répond aux questions que se posent aujourd’hui les institutions...comment diffuser largement et de manière ouverte, tout en
gardant le contrôle sur mes données ?Si je travaille en partenariat et en complémentarité avec
d’autres acteurs, comment maintenir mon image et mes flux d’utilisateurs ?
Comment donner accès de manière simple (et transparente pour mes utilisateurs) à un nombre croissant de ressources, néanmoins choisies et validées ?
Comment gérer l’évolution rapide de mes ressources, et de celles de mes partenaires, sans bouleverser sans cesse mon architecture et mes données ?
13/05/2005 Emmanuelle Bermès 41
Un protocole d’échange : l’OAI (5)Un protocole d’échange : l’OAI (5)
La création des métadonnéesrécupération des notices du catalogue
transformation en Dublin Coreautomatisée
avec des tables de conversion
concertation avec les partenairespour garantir l’homogénéité des données descriptives
sur le réseau
13/05/2005 Emmanuelle Bermès 42
Un protocole d’échange : l’OAI (6)Un protocole d’échange : l’OAI (6) Organisation de la collection dans l’entrepôt pour
faciliter le moissonnage sélectif Création d’ensembles (sets) pour trier les notices
par type de documents (monographies, manuscrits, cartes et plans …)
par dossiers thématiques (=sélection de documents), fonds documentaires (=ensembles cohérents)
avec la classification Dewey pour permettre une sélection par thèmes
Possibilité d’organiser la collection de manière hiérarchique
13/05/2005 Emmanuelle Bermès 43
Un protocole d’échange : l’OAI (7)Un protocole d’échange : l’OAI (7)
L’entrepôt de la BnF aujourd’hui…
environ 30 000 notices au format DC simple
64 ensembles thématiques ou collections décrites en DC
26 000 monographies, 1300 cartes et plans, 2500 manuscrits et ouvrages de la réserve
13/05/2005 Emmanuelle Bermès 44
ConclusionConclusion
Stockage des documentsMétadonnées descriptives :
catalogue Métadonnées
en METSSystème d’archivage
Entrepôt OAImétadonnées en DC
WEB
prestataires catalogueurs
internautes
Visualisation
noticesTables
des matières
Structure physique
extraction automatique
Production
Traitement
Stockage
Accès
13/05/2005 Emmanuelle Bermès 45
ConclusionConclusion
Les difficultés :mettre en place des
outilsappliquer des normesproduire, traiter,
maintenir les métadonnées
entraîne :les coûtsl’organisation
Les avantages :visibilitépréservationpossibilité d’évolution
entraîne :gain de temps et de
qualitépour la préservation
on ne peut pas en faire l’économie
Enjeux des métadonnées :
13/05/2005 Emmanuelle Bermès 46
ConclusionConclusion Pour les bibliothèques, les métadonnées
impliquentune évolution des besoins
plus seulement des métadonnées descriptivesgestion de documents structurés ou à structurer (XML)
une évolution des compétences métieraugmentation des compétences techniquesgérer les compétences documentaires dans un
environnement nouveau
un déficontinuer à remplir les missions de conservation et de
communication dans un environnement nouveaucollaborer avec d’autres acteurs que les bibliothèques