1 Kosten der digitalen Langzeitarchivierung AP5 - Kosten Experten-Workshop 9.12.2008 Frank Dickmann
1
Kosten der digitalen Langzeitarchivierung
AP5 - Kosten
Experten-Workshop
9.12.2008
Frank Dickmann
2
Lang, Susanne. 2008. Ist-Zustand der Langzeitarchivierung von Digitalisaten: Die Ergebnisse der Fragebogenaktion. Expertengespräch „Vom Digitalisierungsprojekt zur organisierten Langzeitarchivierung“, 11.11.2008, Bayerische Staatsbibliothek, München, http://www.digitale-sammlungen.de/mdz/content/veranstaltung/2008-11-11/02_expertengespraech_20081111_ergebnisse_fragebogen.pdf
Kosten der LZA
Allgemeine Kostenformel nach LIFE1 22
3
CreationOr
Purchase
CreationOr
PurchaseAcquisitionAcquisition IngestIngest Bitstream
PreservationBitstreamPreservation
ContentPreservationContentPreservation AccessAccess
1Lifecycle Information For E-Literature – 2. Projektphase.
2Quelle: Ayris, P., R. Davies, et al. (2008). The LIFE2 final project report. London, UK, LIFE Project. http://eprints.ucl.ac.uk/11758/1/11758.pdf.
4
Schema der Kostenbereiche
• Basiert auf den Ergebnissen des Projekts LIFE 2• Orientiert sich weitestgehend an den Prozessen des
Open Archival Information System (OAIS)
AcquisitionAcquisition IngestIngest AccessAccess Bitstream-PreservationBitstream-
PreservationContent-
PreservationContent-
Preservation
- Submission Agreement
- IPR- Check-In- Selection- Ordering &
Invoicing- Obtaining
- Quality Assurance
- Metadata- Deposit- Holdings
Update- Reference
Linking
- Access Provision
- Access Control
- Repository Administration
- Storage Provision
- Backup- Inspection
- Preservation Watch
- Access Control
- Preservation Planning
- Preservation Action
Kostenverteilung anhand des Kostenschemas und der Kostenarten
5
AcquisitionAcquisition IngestIngest AccessAccess Bitstream-PreservationBitstream-
PreservationContent-
PreservationContent-
Preservation
Beagrie1: 42%Beagrie:
35%Beagrie: 23%
Ashley2, Beagrie: höchster Anteil durch Personalkosten ca. 70%
Ashley: zweitgrößter Posten durch Storagekosten
Schlussfolgerung: Der Fokus der Betrachtung muss auf den Kostentreibern liegen,
die besonderen Einfluss auf Personal- und Storagekosten besitzen!
1Quelle: Beagrie, Neil; Chruszcz, Julia; Lavoie, Brian. 2008. Keeping research data safe. London, UK, Joint Information Systems Committee (JISC). http://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf.
2Quelle: Ashley, Kevin. 1999. Digital Archive Costs: Facts and Fallacies. DLM-Forum on Electronic Records (DLM ’99), Brussels, DLM-Forum. http://ec.europa.eu/archives/ISPO/dlm/fulltext/full_ashl_en.htm.
Kosten für Access (Helpdesk)
• Steht im Kontext mit dem erweiterten LZA-System, welches den eigentlichen Zugriff auf die Daten ermöglicht
• Mitarbeitereinsatz – 1st Level Support -> Techniker
• Bearbeitung von Trouble Tickets und Anfragen• Unterstützung bei Nutzung des LZA-Systems
– 2nd Level Support -> Wissenschaftler• Systementwicklung und -integration• Wartung des LZA-Systems
• Zwei mögliche Service Level-Varianten:1. GWDG-Variante: identische Service Level-Zeiten wie GWDG
2. Minimum Variante: Angebot bietet nur Mindestverfügbarkeit bei 1st Level Support
6
Kosten für Access (Helpdesk)1. GWDG-Variante
Support Level LZA-Kosten (€/j)
1st Level 305.856,00 €
2nd Level 154.432,00 €
Gesamt 460.288,00 €
7
Servicezeit(2nd Level)
Erreichbarkeitszeit(1st Level) Betriebszeit
Montag – Donnerstag 09:00 – 16:00 07:00 – 23:00 0:00 – 24:00Freitag 09:00 – 13:00 07:00 – 23:00 0:00 – 24:00Samstag + Sonntag - 10:00 – 18:00 0:00 – 24:00Feiertage - - 0:00 – 24:00
Kosten für Access (Helpdesk)2. Minimum Variante
Support Level LZA-Kosten (€/j)
1st Level 128.016,00 €
2nd Level 154.432,00 €
Gesamt 282.448,00 €
8
Servicezeit(2nd Level)
Erreichbarkeitszeit(1st Level) Betriebszeit
Montag – Donnerstag 09:00 – 16:00 09:00 – 17:00 0:00 – 24:00Freitag 09:00 – 13:00 09:00 – 17:00 0:00 – 24:00Samstag + Sonntag - - 0:00 – 24:00Feiertage - - 0:00 – 24:00
9
Kosten der Bitstream Preservation(Service Level)
10
Service Level 5 Jahre 10 Jahre 30 Jahre 100 Jahre
Online Storage
Nearline Storage
HSM1
1Hierarchical Storage Management
Kosten der Bitstream Preservation(Merkmale/Annahmen)
• Annahmen:– 2,0% Kostensteigerung pro Jahr (berücksichtigen der Inflation)
– 1,5% Personalkostensteigerung pro Jahr
– Storage-Expansion = Verdoppelung der Kapazität alle 3 Jahre
• 1 GB wird seitens Rechenzentren mit ca. 1 € pro Jahr berechnet• Berechnet auf Basis von Angaben der GWDG zu den
Speichersystemen und der entsprechenden Migration in Folge von Re-Investitionen:
11
Merkmale Online Storage Nearline Storage
Kapazität 500 TB 1.500 TB
Abschreibungszyklus 5 Jahre 7 Jahre
Preis (€/GB)/j 1,01 € 0,16 €
12
13
14
Kostenverlauf nach Beagrie
15
Quelle: Beagrie, Neil; Chruszcz, Julia; Lavoie, Brian. 2008. Keeping research data safe. London, UK, Joint Information Systems Committee (JISC). http://www.jisc.ac.uk/media/documents/publications/keepingresearchdatasafe0408.pdf.
Zwischenresümee und Fragestellungen für die Break Out Session
• Kostentreiber der LZA sind:– Service Level-Intensität
– Anzahl und Komplexität der akzeptierten Formate eines Langzeitarchivs
• Für die Förderer ist die langfristige Finanzierung von Interesse– Mit-Beantragung von Drittmitteln für die Langzeitarchivierung in
Forschungsprojekten
– Entwicklung einer „Rentenformel“, die eine Finanzierung im Rahmen von Forschungsprojekten erlaubt
• Fragestellungen– Validierung des Modells
– Kostenvergleich mit Grid Computing -> am Beispiel Amazon E3
– Ist eine „Rentenformel“ als Finanzierungsvariante für die LZA sinnvoll und wie sollte diese gestaltet werden?
16