EDepots in het CVAa en het NAi
Post on 05-Jun-2015
1083 Views
Preview:
DESCRIPTION
Transcript
Een eDepot voor architectuurarchievenEen eDepot voor architectuurarchieven
Centrum Vlaamse Architectuurarchieven CVAaCentrum Vlaamse Architectuurarchieven CVAaVlaams Architectuurinstituut VAiVlaams Architectuurinstituut VAi
- - Nederlands Architectuurinstituut NAiNederlands Architectuurinstituut NAi
Sofie De Caigny/Annelies NevejansSofie De Caigny/Annelies NevejansHenk VanstappenHenk Vanstappen
2
Een eDepot voor architectuurarchieven
• NAio Context : CIS, ArchiVista en digitalisering in NAio Vooronderzoek: archiefpraktijk in bureauso Archiveringsbeleido eDepot testbed
• VAi/CVAao Context: kennis ontwikkeleno Testcase: Jaarboek Architectuur Vlaandereno Fedora Commons als eDepot o Toekomst: standaarden en samenwerking
3
Een eDepot voor het NAi
o Context : CIS, ArchiVista en digitalisering in NAio Vooronderzoek: archiefpraktijk in bureauso Archiveringsbeleido eDepot testbed
4
Nederlands Architectuurinstituut (NAi)
• Archief, Museum, Bibliotheek en Cultureel podium
• Archieven en collecties van Nederlandse architecten van na 1800 bewaren en toegankelijk maken
• Als sectorinstituut voorzien in mogelijkheden voor onderzoek en platform bieden voor discussie
• Zowel het professionele werkveld als het grote publiek informeren, inspireren en stimuleren door middel van tentoonstellingen en publicaties.
5
Collectie Informatie Systeem (CIS)
• Collectieso Bibliotheeko Objecteno Archief
• Authoritieso Personen & organisatieso Projecteno Events
• Procedureso Verwervingo Conservatie/restauratieo Bruikleeno Opslag en verplaatsing
6
Collectie Informatie Systeem (CIS)
7
ArchiVista (2009-2010)
• Toegang op collecties
• Toegang op authorities
• Harvesting externe databases (OAI-PMH)
• User generated content
• Google Maps
• Printing on Demand
• Toegang tot gedigitaliseerde / born digital content
8
CIS - Archivista
9
Digitale objecten in collecties
• Digitaliseringsprojecten (280 Gb/jaar)o Archief Jan Duikero Fotoarchief Tentoonstellingsraado Fotobestellingen
• Born digital (164 Gb/jaar)o Archief Carel Weebero Archief Abel Cahen
Project eDepoto Hoe beheren / Hoe preserveren ?o Hoe koppelen met CIS-metadata ?o Hoe content beschikbaar stellen in ArchiVista ?
10
CIS – ArchiVista - eDepot
11
Vooronderzoek: bureau enquête
• 4 architectenbureaus
• Onderzoek naaro Hard- en softwareomgevingo Intern archiveringsbeleido Problemen bij conversieo Gebruik van standaardeno Ontwikkelingstraject
• Opvragen van digitale projectdossiers
12
Vooronderzoek: resultaten
• Weinig diversiteit in software, hardware en operating systems
• Overgang naar nieuwe omgeving stelde geen problemen
• Overal backup beleid of -maatregelen
• Migratie gebeurt ad hoc, geen beleid (maar ook weinig problemen)
• Overgang naar nieuwe omgeving zelden gedocumenteerd
• Geen beleid voor verversen van dragers
• Authenticiteit is geen issue
• Geen standaarden voor metadata
13
Vooronderzoek: analyse dossiers
• Bevestiging resultaten enquête
• 90 % leesbaar
• Veel derivaten van zelfde bestand
• Bestandsstructuur, namen van folders en files zijn essentiële aanvulling op beperkte metadata
• Output documenten zijn mijlpaaldocumenten
14
Archiveringsbeleid: uitgangspunten
• Algemene doelstelling NAi: ontwerpproces documentereno Intellectuele inhoud prevaleert over functionaliteit
• Aanbod van architecten(bureaus):o Weinig impact op archiefvormingo Uiteenlopende bestandsformaten aangebodeno Problematisch archiveringsbeleid bij archiefvormer
• Beperkte middeleno Geen computer museumo Geen software museumo (Virtuele) emulatie (voorlopig) geen optieo Budget 100.000 – 300.000 euro
15
Archiveringsbeleid: methodes
• Originele bestand wordt steeds bewaard
• Voor elk proprietary format één de jure open formato Intellectuele inhoud bepaalt archiveringsformaato Meerdere archiveringsformaten mogelijk
• Migratiestrategie:o Migratie toepassen op mijlpaaldocumenteno Uitgestelde migratie voor secundaire documenten
• Technology watch
16
Testomgeving: functies
• Virus check
• Log bestandsnaam en –locatie
• Dedupliceren
• Identificeren en valideren o DROIDo Pronom-database
• Migrereno Tools
• Opslago Dspace ?
17
Conclusie: issues
• Proactief overleg met archiefvormer (architect)
• Impact op acquisitiebeleid (data, hardware, software)
• Workflow inpassen in bestaand praktijk
• Selectie noodzakelijk (mijlpaal documenten, formaten)
• Intellectuele inhoud primeert boven look&feel
• Technology watch noodzakelijk (CAD-formaten)
18
Een eDepot voor het VAi
• Context: kennis ontwikkelen
• Testcase: Jaarboek Architectuur Vlaanderen
• Fedora Commons als eDepot-applicatie
• Toekomst: standaarden en samenwerking
19
Centrum Vlaamse Architectuurarchieven (CVAa)
• Het CVAa werd in 2003 onder de koepel van het Vlaams Architectuurinstituut opgericht
• CVAa is een cultureel thema-archief voor architectuurarchieven• Missie van het CVAa: kennis, internationale expertise en best practises
verzamelen, ontwikkelen en verspreiden in Vlaanderen. Doelgroep: archiefinstellingen (cfr. versnipperde bewaring van architectuurarchieven in Vlaanderen)
• CVAa fungeert dus als een expertise- en coördinatiecentrum en bouwt geen eigen collectie architectuurarchieven op
20
vraagstelling m.b.t. eDepot
• De architectuurpraktijk genereert sinds de jaren 1990 zeer veel digitale objecten > een toekomstig archiefbeleid tov architectuur kan niet zonder een visie, kennis over en instrumenten voor een duurzaam digitaal beleid tov architectuurarchieven
• CVAa wil kennis ontwikkelen over archivering van digital born architectuurarchieveno Wat zijn de grootste moeilijkheden die een digitaal depot met zich brengt?o Welke aspecten zijn zeer eigen aan het ontwikkelen van een eDepot voor architectuurarchieven?o Welke technologie en expertise is generiek en komt terug in verschillende sectoren die met
eDepots bezig zijn?o Wat is de rol van CVAa in de archivering van digital born architectuurarchieven?
• Om antwoorden op bovenstaande vragen te kunnen formuleren, én om te vermijden te vervallen in een intensieve studie van andere voorbeelden en studies – ervaring is de beste leerschool – werd beslist een testcase op te starten
21
voorwaarden testcase
o Beperkt budget | beperkte timing (6 maanden)
o eDepot moet aan de OAIS-norm voldoen
o eDepot moet internationale standaarden en protocollen integreren met het oog op het uitwisselen van informatie met andere systemen, o.a. OAI-PMH
o eDepot moet worden gebouwd met bestaande ‘off-the-shelf’ instrumenten die bij voorkeur open source zijn
22
use case: Jaarboek Architectuur Vlaanderen
• Tweejaarlijks boek over hedendaagse architectuur in Vlaanderen, gepubliceerd door het VAi
• Kleine, beheersbare collectie: ca. 350 projecten worden ingezonden bij elke oproep. Daarvan wordt een kleine groep (ca. 10 %) effectief gepubliceerd. Van deze 10% bestaan bijkomende datastromen.
• Samenstelling van een object: elk object bestaat uit een bundel van meervoudige (digital born) datastromen (die in een beperkt aantal formaten wordt aangeleverd) die een logisch geheel vormen
• De collectie is klein maar heeft een hoge culturele waarden aangezien ze een doorsnede is van de hedendaagse architectuurproductie in Vlaanderen
23
use case: Jaarboek Architectuur Vlaanderen
• 750 objecten
• 11800 datastromen
• 50 GB
24
selectie van een systeem voor eDepot
VOORONDERZOEK• Verschillende ‘communities*’, organisaties en instituties ontwikkelen en
onderhouden eDepots om digitale objecten in te bewaren, en zij delen rijke collecties digitale objecten.
• Een al te enge kijk op de specificiteit van materialen en toepassingen heeft geleid tot een enorme variëteit aan parallelle technologieën en heterogene benaderingen bij de ontwikkeling van eDepots.
• In het algemeen blijkt dat de belofte en het potentieel van de bestaande ‘off-the-shelf’ standaarden en uniforme instrumenten die door een ‘community’ worden ontwikkeld, tot nog toe onvoldoende zijn geëxploreerd.
* community: een (open source) software-community brengt gebruikers van die software samen zodat ze verbeteringen, applicaties en ervaringen kunnen uitwisselen
25
DSpace
Fedora
Commons
EPrints
institutional repository system - 2002
MIT Libraries / Hewlett Packard
open source (BSD License) – 305 installaties
repository system - 2003
Cornell University / Univesity of Virginia
open source (Mozilla Public License)
institutional repository system - 2001
University of Southampton
open source (GNU License)
CCSDS OAISCCSDS OAISIngest
Access
Archival Storage
Archival Management
Administration
Reservation Planning
selectie van een systeem voor eDepot
26
• Fedora voordeleno open sourceo complex digitaal objectmodel dat grote aantallen en een verscheidenheid van
datastromen ondersteunto Interfaces (API’s) voor Zoeken, Opslaan en Ophalen van objecteno Rich Object Behavior: mogelijkheid om tools te ontwikkelen die met de objecten
in het eDepot aan de slag gaan (viewers, preservation services,…)o Schaal: > 1 miljoen objecteno Batch Support: kan op een eenvoudige manier grote hoeveelheden objecten
importeren of exportereno Modulair systeem: kan flexibel worden uitgebreid met andere diensten en
archiveringsoplossingen
• Fedora nadeleno Alleen ‘middleware’ en ‘storage’; vereist de ontwikkeling van
gebruiksvriendelijke front-endo Geen pasklare instrumenten om datamodellen te definiëren
selectie van een systeem voor eDepot: voor- en nadelen van Fedora
27
FEDORA REPOSITORY
ISLANDORA BRIDGE
DRUPAL WEB FRONTEND
(FEDORA) STORAGE LAYER
bouwstenen van de fedora-based repository van CVAa
CMS voor websites in PHP
Drupal Association
Open source (GNU General Public License)
Module om de Drupal-interface te koppelen aan Fedora
University of Prince Edward Island (UPEI)
Open source (No license)
Digital Object Repository system
Cornell University / Univesity of Virginia
open source (Mozilla Public License)
28
digitaal object
29
digitaal object
30
DATASTREAM N
fedora digitaal object
DATASTREAM 2
PERSISTENT ID
SYSTEM
PROPERTIES
…
DATASTREAM 1
digitaal object identifier
manage & track the object
aggregates content items
CCSDS OAIS AIPCCSDS OAIS AIPContent Information
Data Object
Preservation Infomation
Representation Information
Packaging Information
Fedora digital object Fedora digital object
model is model is
represented in XML represented in XML
(FOXML)(FOXML)
31
fedora digitaal object
PERSISTENT ID
SYSTEM
PROPERTIES
RESERVED
DATASTREAMS
DUBLIN CORE
(DC)
AUDIT TRAIL
(AUDIT)
RELATIONS
(RELS-EXT)
metadata over het object
automatische registratie van alle wijzigingen die aan een object worden aangebracht
beschrijft relaties met andere digitale objecten
willekeurig aantal datastromen door de gebruiker aan het object toe te voegen
32
fedora digitaal object
PERSISTENT ID
SYSTEM
PROPERTIES
AUDIT TRAIL
RELATIONS
DC
<oai_dc:dc>
<dc:title>Woning Frateur - Hallez</dc:title>
<dc:creator>Architettura</dc:creator>
<dc:subject>Houtskeletbouw</dc:subject>
<dc:publisher>VAI</dc:publisher>
<dc:identifier>info:fedora/vai:765</dc:identifier>
</oai_dc:dc>
image/tiffinfo:pronom/fmt/3
application/pdf
info:pronom/fmt/18
application/pdfinfo:pronom/fmt/18
application/xml
info:pronom/fmt/101
info:fedora/vai:765
managed content
internal XML
managed content
managed content
33
<rdf:description rdf:about="info:fedora/vai:765">
<fedora:isMemberOfCollection rdf:resource="info:fedora/vai:Yearbook2007"/>
<fedora-model:hasModel rdf:resource="info:fedora/islandora:VAI_Yearbook"/>
</rdf:description>
…
VAI YB 2007
…
QUERY
…
Collection Object
E.g. Yearbook 2007
PID 765
…
DS
DS
DS
…
RELS-EXT
…
isMem
berOfCollection
collecties ontwikkelen met relaties
34
belangrijkste kenmerken van Fedora eDepot
• Modulair systeem
• Web service interfaces (REST/SOAP)
• Ondersteunt OAI-PMH & OAI-ORE
• Versiebeheer
• Self-contained objects (alle essentiële eigenschappen staan in XML bestand)
• Indexing gebaseerd op RDF
35
preservatiemogelijkheden van Fedora
• Data-model voor samengestelde digitale objecteno bundelt meerdere datastromeno legt eigenschappen over het object en de datastromen vasto wijst een vaste en wereldwijde unieke ID aan
• XML-gebaseerde Digital Object Storage (FOXML files)o OAIS Archival Information Packages
• XML-gebaseerde Digital Object Ingest and Exporto FOXML, METS, MPEG-21 DIDL, ORE, etc.o OAIS Submission & Dissemination Information Packages
• Automatisch versiebeheer van de inhoud van de datastromen
• Logboek van alle aanpassingen aan digitale opjecten
• Uitbreidbaar met Preservation Support Serviceso bv. Migration services & file format identification
36
architectuur van CVAa eDepot
Isla
ndor
a br
idge
drup
al «
web
site
»File System
(Objects)
OA
IM
AN
AG
EA
CC
ES
S
RDBMS
(Registry)
RDF
Tripplestore
SE
AR
CH
RD
F Q
UE
RY
SE
RV
ICE
BIN
DP
OL
ICY
VA
LID
AT
E
AC
CE
SS
MA
NA
GE
ING
ES
T
ST
OR
ER
EG
IST
RY
RD
F I
ND
EX
end
user
37
eerste conclusies testcase
• Testcase laat toe kennis op te doen over datamodellen
• Met relatief beperkt budget en tijd, kan een duurzaam depot worden gebouwd d.m.v. open source software en gebruik van internationale standaarden
• Door praktijk van eDepot wordt kennis gegenereerd en kan naar concrete antwoorden worden gezocht op de vraag naar de specificiteit architectuurarchieven
• investering:• extern
• huur server: 1.800 € / jaar• ontwikkeling use case: 10.000 €
• intern• coördinator + projectleider: 20 % f.t.e.
38
toekomst
• De bestaande mogelijkheden van het Fedora eDepot van CVAa uitbreideno Ontwikkelen van specifieke metadataschema’s voor architectuurarchieveno Integratie van uitgebreidere collectie informatie – EAD/ISAD(G)o Integratie van disseminatie & preservatie diensten (bv. JPEG 2000 viewer,
instrumenten voor migratie van datastromen)
• Aftasten van de mogelijkheden tot interconnectiviteit en samenwerking tussen verschillende eDepots in een federatie van digitale architectuurarchieven
o Diverse architecturale eDepots toegankelijk maken via een centrale toegang (portal)
o Digitale objecten gebruiken, opslaan en uitwisselen tussen verschillende eDepots en voor verschillende doeleinden
39
toekomst
• Ontwikkelen van adviezen voor archiefvormers/architectenbureaus
• Richtlijnen voor het aanleveren van materiaal voor het Jaarboek Architectuur
40
toekomst:federatie van eDepots voor architectuur
VAi
Ghent
UniversityNAI
ARCH Y
CENTRAL PORTAL: CVAa
Asset
Registry ACCESSACCESS
ACCESS
ACCESSACCESS
ENS-USER | APPLICATIONENS-USER | APPLICATION
Potential technologiesPotential technologiesOAI-PMH
OAI-ORE
OpenURL
41
Conclusies: overeenkomsten CVAa en NAi
• Architectuurarchieveno Specifieke ontsluiting en beschrijving
• Private archieven versus publiekrechtelijke archieven:o geen regelgeving voor vorming archieveno vraagstuk authenticiteit op ander niveau (geen juridische bewijskracht)o selectieo auteursrechteno …
42
Belangrijkste conclusies: verschillen
CVAaE-depot voor use case
• Deelarchief van VAi
• Archief van architectuurorganisatie
• Gesloten collectie
• Integraal, autonoom systeem: Fedora
• Scope op preservering en expertise
NAi
E-depot voor volledige collectie
• Volledige archieven
• Architectenarchieven
• Ingebed in andere collecties
• Koppeling bestaand systeem (CIS)
• Scope op opname en preservering
43
Belangrijkste conclusies: Open standaarden
• Open Standaarden zorgen voor gelijkwaardige uitvoering van functies
• Open standaarden faciliteren gemeenschappelijke services (bijv. preservering)
• Open standaarden vereenvoudigen het uitwisselen van gegevens en gemeenschappelijke beschikbaarstelling
44
Belangrijkste conclusies: welk systeem
• Er is (nog) geen systeem ‘off the shelf’ beschikbaar.
• Ontwikkel eDepot vanuit eigen bestaande behoeften, eisen, wensen
• Ontwikkel eDepot vanuit eigen systeem
• Ieder eDepot moet voldoen aan minimale eisen (functionaliteit, ondersteuning werkprocessen)
• Met relatief beperkt budget en tijd, kan een duurzaam depot worden gebouwd d.m.v. Open Source
• eDepot ontwikkelen is experimenteren, leren en kennis delen
45
h.vanstappen@nai.nl
f.neggers@nai.nl
sofie.decaigny@vai.be
annelies.nevejans@vai.be
top related