Prepare your metadata - intro

Post on 27-Jun-2015

266 Views

Category:

Technology

2 Downloads

Preview:

Click to see full reader

DESCRIPTION

Introductie voor de workshop 'Prepare your metadata' (Brussel, 17 juni 2014)

Transcript

OVER DOMEINEN & IDENTIFIERS

Henk Vanstappen

PACKED vzw PYM workshop 2014-06-18

1. REALITY IS MESSY reality is messy

Carl Lagoze, 2001

Pieter Brueghel de Oude Pieter Brueghel I Pieter Bruegel, 1525-ca 1569 Bruegel, Pieter, 1525?-1569 Bruegel, Pieter de Oudere Bruegel, Pieter, l'ancien Bruegel, Pieter, d.ä. Brueghel, Pieter, o Velho Брейгель, Питер, ок.

האב, פיטר, לBrueghel, Pieter the Elder, 1528-1569 Breughel, Pieter, the Elder

PARIS

KLEED

KLEED

Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa,

(1479-1528); dite La Joconde

Inv . nr. 799 Gian Giacomo Caprotti

Mona Lisa Monna Lisa La Joconde La Gioconda Portrait de Mona Lisa,

(1479-1528); dite La Joconde

Inv . nr. 799 Gian Giacomo Caprotti LHOOQ

Interbellum 1918-1940 11 november 1918 - 1 september 1939 November 11th, 1918 to September 1st, 1939 ca. 1920 – ca. 1935

HET PROBLEEM

Resources niet uniek te identificeren Resources niet vindbaar Resources niet uitwisselbaar Extra metadata noodzakelijk

OPLOSSING#1: LIJSTJES lijsten afspraken maar: veel werk maar: probleme uitwisselbaarheid blijft

OPLOSSING#2: AUTHORITIES

OPLOSSING#3: ON LINE AUTHORITIES

OPLOSSING#4: LINKED OPEN DATA Machineleesbaar Persistent Uniek: domein+identifier

EXTERNE BRON (AUTHORITY)

•  binnen een bepaald domein •  unieke identificatie van resource •  eventueel verrijkt met bijkomende

gegevens •  te bevragen via http-protocol •  syntax:

namespace (domein) + identifier

DOMEINEN & IDENTIFIERS

domein identifier Jansens Jan ISBN 978 0 5862 0747 5 HTML <a> EAD <name> AAT 300033618 Wordnet painting

DOMEINEN & IDENTIFIERS

namespace identifier viaf.org 95761864 wikipedia.org Pieter_Bruegel_the_Elder dbpedia.org Pieter_Bruegel_the_Elder geonames.org 2800867

PERSISTENTE URLS

base url identifier http://viaf.org/viaf/ 95761864/ http://wikipedia.org/ Pieter_Bruegel_the_Elder/ http://dbpedia.org/page/

Pieter_Bruegel_the_Elder/

http://geonames.org/ 2800867/

KWALITEITSEISEN URI (SYNTAX)

•  Persistent en uniek •  Enkel letters, cijfers, underscore, hyphen •  Logische, eenvoudige opbouw •  Human readable •  Systeemonafhankelijk (geen query strings)

KWALITEITSEISEN URI (SYNTAX) Wel: http://collectie.museum.org/data/12345 http://museum.org/collectie/data/12345 http://museum.org/collectie/12345/data Niet: http://europeana.eu/portal/record/15503/E627F23EF13FA8E6584AF8706A95DB85908413BE.html http://www.culture.gouv.fr/public/mistral/joconde_fr?ACTION=CHERCHER&FIELD_1=REF&VALUE_1=000PE025604

KWALITEITSEISEN EXTERNE BRON

Inhoud •  scope •  volledigheid •  correct •  toegevoegde data (rijkdom) •  koppeling met andere authorities

KWALITEITSEISEN EXTERNE BRON

Beheer •  persistente bron •  open licentie •  uitbreidbaar Toegang •  machineleesbaar (xml, json) •  GUI (html) •  API (OpenSearch, SRU, …)

VOORBEELD: VIAF Links: http://viaf.org/ http://viaf.org/viaf/95761864/ http://viaf.org/viaf/95761864/rdf.xml http://viaf.org/viaf/95761864/viaf.xml http://viaf.org/viaf/95761864/marc21.xml http://viaf.org/viaf/95761864/justlinks.json Queries: http://viaf.org/viaf/search?query=cql.any+%3D+”Brueghel, Pieter”&httpAccept=application/rss%2bxml

AGENDA Intro (Henk) Wat & hoe (Alina) •  Welke bronnen zijn geschikt? •  Persistente URI creëren Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: •  Data cleanen met Open Refine (Alina) •  Systemen aanpassen: Adlib en CA (Jeroen & Joris) •  Proof of the pudding: verrijkte collectiecatalogus (Bert)

AGENDA Intro (Henk) Wat & hoe (Alina) •  Welke bronnen •  Persistente URI Oefening: normaliseer en verrijk 10 objecten {pauze} Demo’s: •  Data cleanen met Open Refine (Alina) •  Systemen aanpassen: Adlib en CA (Jeroen & Joris) •  Proof of the pudding: verrijkte collectiecatalogus (Bert)

OEFENING 1. Download CSV file bit.do/pyd 2. Beschrijf werken in CSV file 3. Selecteer relevante domeinen en voeg waar

mogelijk PURLs toe voor namen, concepten, locaties en agents

4. creeer een PID voor de werken 5. creeer een PID voor de beschrijvingen (data)

top related