This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
The world’s libraries. Connected.
Développements récents chez OCLC
Journées ABES, Montpellier, 2014-05-20
Janifer Gatenby
EMEA Program Manager Metadata, OCLC
OCLC – face services & produits
OCLC – face données
• ISNI
• Projet Structure bibliographique multi-langues
Présentateur
Commentaires de présentation
Janifer Gatenby is Program manager at OCLC in the Leiden office in the Netherlands where her main project is the ISNI database and system. She is also working on a project with OCLC Research to generate data that will improve mult-lingual displays and the discovery of translated works. She has been working in library automation since the late 1970s and has been working on standards since 1993 (SRU, openURL Request Transfer Message, ISO Holdings, ISO data elements, ISNI, ISCI, Z30.50 among others).
The world’s libraries. Connected.
Face services
Un Workflow intelligent
Connecté à un réseau global de données
Soutenu par la communauté des bibliothèques
Catalogue (E & P & D)
E-Articles (Mega Index)
Fournisseurs E-Collections E-Licences
Metadonnées Ingest
Metadonnées Syndication
Services et Produits
The world’s libraries. Connected.
Nouveautés WMS FY14
• Gestion des Groupes • Prêt secouru • Gestion multi thesauri • Résolveur de liens et KB améliorés et plus
The world’s libraries. Connected.
La communauté OCLC WMS (en Europe)
• Tilburg University Tilburg, The Netherlands
• Instituto de Empresa, Madrid, Spain
• Bishop Grosseteste University Lincoln, United Kingdom
• Ifremer Brest, France
• Bientôt le consortium de bibliothèques universitaires néerlandaises UKB et la Bibliothèque Nationale des Pays-Bas
The world’s libraries. Connected.
Centres de données
US2 EMEA 1
US1
CAN 1
EMEA 2 Partner 1
APAC 1
Data Centers - rappels
Présentateur
Commentaires de présentation
The OCLC WorldShare Platform is the technical infrastructure on which OCLC’s Webscale services are built and provides data, tools and services for library developers, users and partners to create and share applications collectively. This means libraries can build applications to meet local needs, while benefiting from the innovation of the broader global library community.
Identités publiques des individus et organisations)
Qui créent, fabriquent, gèrent, distribuent ou ont un rôle dans la production des œuvres créatives
Y inclus auteurs, artistes, créateurs, acteurs, chercheurs, éditeurs, et davantage
e.g.: ISNI 0000 0001 2133 4104
Unique
Global
Persistante
Exprimé en HTTP URI http://isni.org/isni/0000000121334104
La Recherche Organismes subventionnaires Sociétés professionnelles Bases de données d’articles Bases de données de thèses
Inter-domaines Identifiant “pontage”
Archives et Musées
Présentateur
Commentaires de présentation
The world’s libraries. Connected.
ISNI Mei 2014
• 8 million ISNIs avec statut “attribué” (en 3 ans)
• 16 million liens; ISNI comme « linked data »
# Sources Attribué Liens Recherche 11 832,931 1, 88 million
Droits du texte 6 129,312 675,000 Droits de la musique 5 337,585 442,000
Bibliothèques & commerce 4 6.8 million 12.95 million Organisations 3 408,309 56,000
Présentateur
Commentaires de présentation
BnF as registration agency for all of France – will bring in Archives and museums VIAF / ISNI interoperability meeting – including BNF, BL, BNE, DNB & Thom Hickey
The world’s libraries. Connected.
DROITS DU TEXTE Access Copyright, Canada ACCE
Authors’ Licensing and Collecting Society, UK
ALCS
Centrum Dienstverlening Auteurs- en aanverwante Rechten, Netherlands
CEDA
Centro Español de Derechos Reprográficos
CEDR
Irish Copyright Licensing Agency ICLA
Prolitteris, Switzerland PROL
VG WORT, Germany
VGWO
MUSIQUE
American Musicological Society AMS
British Library Sound Archive BLSA
International Performers’ Database Association
IPDA
MusicBrainz MUBZ
SwissPerform SWISP
RECHERCHE & PROFESSIONNEL
American Musicological Society AMS
Authors Guild AGLD
British Library Theses BRTH
Digital Author identifier, Netherlands DAI
Jisc Names Project, UK JNAM
La Trobe University AU:VLU
Modern Languages Association MLA
OCLC Theses OCLCT
ORCID and DataCite Interoperability Network
ODIN
AuthorClaim and RePec OPENL
Proquest Theses PROQ
Scholar Universe, Proquest SCHU
Electronic tables of content ZETO
ORGANISATIONS
American Chemical Society ACS
Boekenbank, Belgium BOEK
Bowker Publishers BOWP
Publishers Licensing Society, UK PLS
Ringgold RING
SOURCES GENERAUX
BookNet Canada BNC
Bowker Books in Print BOWKER
The European Library (48 national libraries)
TEL
Virtual International Authority File (33 libraries)
VIAF
Sources actuelles 33… en plein croissance
The world’s libraries. Connected.
ISNI pour les bibliothèques
• Contrôle d’autorité ensemble • Fusions et scissions en ISNI prennent effet en VIAF
• Economies de gestion collective, inter-domaines
• Plus de données, plus de confiance
• « Crowd sourcing » (homologué par ISNI QT – équipe de qualité)
• Infrastructure de contrôle de la qualité • BnF / BL = QT
• Programmes et indexes pour la détection d’anomalies = OCLC
• Système de notification • Diffusion de corrections
• Liens inter-domaines • Base de données de référence
ISNI has provided ORCID with a range of identifiers. ISNI and ORCID are sharing the same scheme. ORCID has a beta implementation of accessing the ISNI database during researcher registration using the ISNI SRU API. I (Janifer) am on the ORCID Technical Advisory Board and also the Working Group on Multiple Assertions. ORCID and ISNI are working together on a single identifier per researcher; the first phase will be to align the identifiers, then to declare a preferred one. ISNI will harvest from ORCID and can store the ORCID identifier. 70% of the 300,000 ORCIDs so far registered only contain name and email address. In ISNI terms this is sparse data that cannot reliably be used for matching and linking. We are considering whether we can use the email address (if it is available) to determine and institution affiliation so as to pass the ISNI sparseness test. ISNI does not collect email addresses.
The world’s libraries. Connected.
WorldCat OCLC – face données
• Ressources en presque tous les langues
• En provenance de plus de 20,000 bibliothèques
• Moins de 50% anglais (français 3ème)
Présentateur
Commentaires de présentation
There are more than 300 million records in WorldCat today representing holdings of the world’s libraries. There are also another 200 million articles. Of the 300 million, more than half are in languages other than English.
The world’s libraries. Connected.
Architecture actuel
Authors Author
s Auteurs
Subj Classif Subj
Classif Vedettes,Classif.
Holding Holdin
g Localis’n
Notice Bibliographique
Grappe œuvre
Grappe Contenu
Grappe Manife-station
Présentateur
Commentaires de présentation
The existing architecture is bibliographic record centric. There may be links to author and subject authority records. The work, manifestation and content clusters only contain identifiers, no metadata at present.
The world’s libraries. Connected.
Initiatives Complémentaires
Métadonnées niveau œuvre
GLIMIR Grappes sous
œuvres – contenu /
manifestation
Structure bibliographique multi-langues
Présentateur
Commentaires de présentation
Three complementary initiatives are in progress concerning multi-lingualism and WorldCat.
The first project – generation of metadata at work level to make better presentations.
The world’s libraries. Connected.
• La Grappe des notices ou le Contenu est égal • Permet une amélioration d’affichage • Permet un choix de format et présentation des formats qui peuvent servir comme
substituts • Consolidation des localisations & exemplaires
• La Grappe des notices au niveau Manifestation • Consolidation des localisations & exemplaires • Dans un premier temps permet la sélection d’une notice la plus appropriée en
langue de catalogage qui correspond avec la langue de l’utilisateur • Réduit l’apparence de doublonnage • Permet un chiffre plus fiable du nombre de manifestations dans WorldCat (par
apport le nombre de notices)
GLIMIR
Présentateur
Commentaires de présentation
The GLIMIR project creates clusters of parallel records for the same manifestation (manifestation cluster) and also clusters for the same content, though the form may be different (print, microform, digital). We are in the process of trawling thorugh the database to make these clusters. Only the part in blue will be changed by the multi-lingual bibliographic structure approach
The world’s libraries. Connected.
Création de vrai affichage multi-langues • Au niveau œuvre et manifestation
• Reconstruction utilisant tous les données appropriés au lieu de “la notice la plus appropriée”
Correction des 28 million notices en langue “und” • Si possible
Amélioration du traitement des traductions Affinage des grappes œuvres
Projet Structure bibliographique multi-langues
Présentateur
Commentaires de présentation
Concerning correcting records coded as “und” = “undetermined”, we expect that we can correct about 7 million by searching for the same title string in other records.
The world’s libraries. Connected.
• Worldcat.org fait un choix d’une seule notice pour la représentation de l’œuvre dans la liste des résultats
• Même avec les grappes GLIMIR, cela ne donne pas une expérience satisfaisante pour l’utilisateur.
• Pourquoi..
“Plus approprié” en question
Présentateur
Commentaires de présentation
Currently when the short list and full displays are created, the system selects the most appropriate record for display. The most appropriate record is determined by its size and the number of associated holdings and it was envisaged to extend this to include the language of cataloguing. But we think we can do much better by questioning the “most appropriate record” concept.
The world’s libraries. Connected.
Quelle notice est la meilleure pour un allemand?
Comment choisir entre une notice avec sommaire et une autres avec vedettes?
Présentateur
Commentaires de présentation
Here the first record is catalogued in German but has no significant German content – no subject headings and no notes. There are other richer records that could inform the user better.
The world’s libraries. Connected.
Nouveau architecture suggéré
Œuvre
eng fre
ger
jpn
Manif eng Manif
eng Manif eng
Manif eng
Manif eng Manif
eng
o fre Notes Sommaire
++
Holding Holdin
g Localis’n
Holding
Subj sif
Vedettes Classif
eng
fre ger
jpn
Authors Author
s Auteurs eng
fre ger
jpn
eng
fre
ger
jpn
eng
fre
ger
jpn
Translations (Language of work)
Manif fre
Localis’n
Présentateur
Commentaires de présentation
This is the theoretical bibliographic structure that will no longer be bibliographic record centric but work centric. All information – authors, notes, summaries, subject headings will be flagged with the language of cataloguing.
The world’s libraries. Connected.
• Codage des éléments par langue, en particulier: • Titres
• Titres originaux
• Sommaires
• Vedettes
• Affichage dans la police préférée d’un utilisateur si possible
• Affichage des localisations par œuvre, contenu, manifestations
Principes
Présentateur
Commentaires de présentation
The work level metadata will be tagged with language for each data element. Instead of always showing the data from the main title in the record, the alternative script fields may be chosen for display, depending on what the system can determine about the user, e.g. from IP address range or expressed preference. Worldcat.org already includes the ability to change language of display, but the numbers of fields that change will be enhanced and the tabulation of several displays will be improved. Consolidate holdings from all records that re applicable to a display (work, content, manifestation level)
The world’s libraries. Connected.
Présentateur
Commentaires de présentation
The Grand Design; English in Italian UI with Translations table.
The world’s libraries. Connected.
Présentateur
Commentaires de présentation
Same in Japanese interface
The world’s libraries. Connected.
Traductions
The world’s libraries. Connected.
• La crème de la littérature, discours scientifiques, écologique, économique, c’est-à-dire le culture, l’héritage est partagée par moyen de traduction.
• WorldCat contient les notices pour la plupart de ces traductions importantes
Les grandes œuvres sont traduits
BUT: Utiliser les notices de qualité pour améliorer les autres et en même temps
améliorer les grappes, présentations, notices d’autorité et « linked data »
Présentateur
Commentaires de présentation
Instead of working directly with lesser quality records to improve the quality in WorldCat and instead of working with the long tail, we are turning our attention to the most important works and working ways to use the good records to improve the quality.
The world’s libraries. Connected.
• Contenu – l’œuvre et ses expressions - traductions
• Amélioration des grappes FRBR
• Ajouter à VIAF
• Diffusion à partir de VIAF comme « linked data »
Gérer les notices d’autorité œuvre
The world’s libraries. Connected.
Titre: Journey to the West Langue: Anglais Traducteur: Anthony C. Yu Date: 1977 IsTranslationOf:
Titre: Journey to the West Langue: Anglais Traducteur: W. J. F. Jenner Date: 1982-1984 IsTranslationOf:
Titre: 西遊記 Langue Chinois Auteur: 吳承恩 Crée: 1592 HasTranslation:
Titlr: Tây du ký bình khảo Langue: Vietnamienne Traducteur: Phan Quan Date: 1980 IsTranslationOf:
Un œuvre peut avoir maintes traductions. -Traduit en plusieurs langues -Traduit plus d’une fois en une langue
Présentateur
Commentaires de présentation
Thank you to Dan Benson and Karen Smith Yoshimura for this slide
The world’s libraries. Connected.
Les notices d’autorité pour les traductions
Présentateur
Commentaires de présentation
Il y a une notice pour l’œuvre crée par NLA, LC et XR (OCLC Research). Pour les traductions, XR a augmenté le nombre considérablement. Le programme détecte le titre original, le traducteur et le titre traduit et il lie les traductions avec la notice pour l’œuvre et pour l’auteur.
The world’s libraries. Connected.
Présentateur
Commentaires de présentation
VIAF Consolidated display – shows work with expressions summary.
The world’s libraries. Connected.
Présentateur
Commentaires de présentation
This is the full expressions summary for the work Pêcheur d’Islande
The world’s libraries. Connected.
Présentateur
Commentaires de présentation
VIAF Full display – shows all the expressions, e.g. different translations with the title and the translator and the earliest determined publication date
The world’s libraries. Connected.
Enrichissement important de VIAF
Auteur Titre Expressions dans VIAF Nombre de traductions dans WorldCat
Atwood Blind assassin 8 31
Guevara Notas de viaje 0 11
Hawking Grand design 0 18
Lenard Grosse naturforscher 1 3
Loti Pêcheur d’Islande 1 31
Présentateur
Commentaires de présentation
These records will enrich VIAF. There is no risk of generating bad records. The translation records will include both the translated title and the translator (both are not usually included in existing records in VIAF) Most of the expression records will be new to VIAF.
The world’s libraries. Connected.
• # manifestations au lieu de # notices
• # œuvres avec traductions
• Les auteurs les plus traduits et leurs titres
• Et davantage
Bientôt on va savoir
Présentateur
Commentaires de présentation
Just think. How many of the 150+ million records that are for non English language works are actually translations of English language records. And how many of the English language records are also translations? It could be as high as 25%? Once we have these records generated, it will open many new possibilities. Also, we know we have 300 million records, but how many real resources do we have? GLIMIR will produce these figures. We are just starting…
The world’s libraries. Connected.
• Merci
The world’s libraries. Connected.
• Formats disponibles de VIAF • MARC-21
• XML
• RDF (linked data)
• Just links in JSON
• Et autres possibilités dans l’avenir
Diffusion des notices
Présentateur
Commentaires de présentation
The newly generated records will be available in the formats as distributed by VIAF.
The world’s libraries. Connected.
WorldCat Today
• Bibliographic Records • Hybrid records
• Parallel records
• Clustered at Work level (FRBR)
Présentateur
Commentaires de présentation
The 300 million records are clustered into works. The records may be in just one language of cataloguing or they may have a mixture of language of cataloguing, e.g. subject heading in more than one language. Parallel records may exist, i.e. records in different languages of cataloguing describing the same resource.
The world’s libraries. Connected.
• Work level data, mined from all associated bibliographic records will be displayed supplemented with expression / manifestation level data as the user drills through the short to fuller versions of the metadata.
Multilingual Bibliographic Structure Project
End user interface will show works and manifestations not bibliographic records; the cataloguing client will also show bibliographic records
Présentateur
Commentaires de présentation
Build the information to display to users from all available records and show them all relevant holdings. Do not display just one selected record from the work set. Cataloguers too will benefit from this, being able to drill down to actual records where appropriate.