České digitalizační projekty, jejich výsledky a agregace Ing. Martin Lhoták Knihovna AV ČR, v. v. i. Konference Knihovny současnosti 10. 9. 2015, Olomouc
České digitalizační projekty,
jejich výsledky a agregace
Ing. Martin Lhoták
Knihovna AV ČR, v. v. i.
Konference Knihovny současnosti
10. 9. 2015, Olomouc
Obsah
Digitalizační projekty
Výsledky průzkumu mezi knihovnami
Česká digitální knihovna - agregace
Digitalizační projekty
Národní digitální knihovna (IOP)
110 000 svazků / 30 000 000 stran
Kramerius 3 v NK 12 200 svazků / 8 700 000 stran
Krajská digitalizace (IOP)
60 000 svazků / 11 000 000 stran
VISK 7 – novodobé dokumenty
1 500 svazků / 450 000 stran ročně (data předávána do NK)
VISK 6 Manuscriptorium – rukopisy a staré tisky
13 750 000 stran
Google books v NK ČR
110 000 svazků / 11 000 000 stran
+ další individuální projekty knihoven např. KNAV, MKP, NLK
Digitalizace - průzkum
Počet digitalizovaných stran novodobých dokumentů
Počet kompletně zpracovaných stran novodobých dok.
Používaný SW pro digitální knihovnu a jeho verze
Zdroje financování
Plánované digitalizační projekty a počet stran do roku 2016
Dotaz na používání Registru digitalizace
Stejné dotazy týkající se rukopisů a starých tisků
Průzkum probíhal v období červenec – srpen 2015
Odpověď poskytlo 22 knihoven
Počet zdigitalizovaných stran novodobých
dokumentů (cca od 1801)
Národní knihovna ČR 37 941 254
Moravská zemská knihovna 30 800 000
Knihovna Akademie věd ČR 5 400 000
Vědecká knihovna v Olomouci 1 544 502
Jihočeská vědecká knihovna 1 530 000
Národní lékařská knihovna 1 050 000
Studijní a vědecká knihovna v Hradci Králové 998 000
Městská knihovna v Praze 960 000
Knihovna Vojenského historického ústavu 800 000
SVI Fakulty sociálních věd Univerzity Karlovy 676 308
Moravskoslezská vědecká knihovna v Ostravě 537 706
Knihovna Ústavu pro českou literaturu AV ČR 370 000
Studijní a vědecká knihovna Plzeňského kraje 366 664
Krajská knihovna Františka Bartoše ve Zlíně 344 774
Knihovna Národního filmového archivu 325 000
Severočeská vědecká knihovna v Ústí nad Labem 323 000
Národní technická knihovna 306 328
Muzeum východních Čech v Hradci Králové 300 000
Středočeská vědecká knihovna v Kladně 271 783
Knihovna Divadelního ústavu 190 000
Krajská knihovna Karlovy Vary 179 146
Městská knihovna Česká Třebová 12 000
CELKEM 85 226 465
Počet zdigitalizovaných stran novodobých
dokumentů (cca od 1801) včetně metadat
Celkem 81 215 274 stran – rozdíl pouze 4 000 000 stran
Financování – jednotlivé projekty a
programy
NDK IOP – 300 000 000 Kč
Krajská digitalizace z OP – cca 150 000 000 Kč (odhad)
VISK 7 – 3 800 000 Kč v roce 2015
VISK 6 – 8 300 000 Kč v roce 2015
Google Books NK ČR – 4 000 000 Kč ročně + dalších
80% hrazeno Googlem (16 000 000 Kč)
PRALIT – 6 850 000 Kč
Plánovaný přírůstek do konce roku 2016
Novodobé dokumenty – 5 636 587 stran – cca 6,5 % nárůst
(+ NDK NK)
Rukopisy a staré tisky – 12 695 000 stran – cca 60 % nárůst
Hlavní charakteristika
Zastřešení českých digitálních knihoven
Sklízení metadat
Jedno vyhledávání nad všemi digitalizovanými daty
Jedno rozhraní pro doručení plných textů
Dynamické nahrávání plných textů
Nejedná se pouze o index
Agregátor pro projekt Europeana
Výstupy projektu volně dostupné pod licencí GNU GPL
Tři podcíle
- systém pro zpřístupnění digitálních dokumentů
- systém pro sledování digitalizačního workflow
- produkční a archivační systém
http://www.czechdigitallibrary.cz
http://cdk-test.lib.cas.cz/client/index.vm
http://cdk-test.lib.cas.cz/client
Systém pro sledování digitalizačního workflow
Vychází z Registru digitalizice CZ
Propojení s produkčním systémem ProArc umožní
automatizované zaznamenávání jednotlivých
digitalizačních kroků
Automatická aktualizace dat v Registru digitalizace
Provedeny analýzy a návrhy obrazovek
Funkční verze plánována na podzim 2015
Produkční a archivační systém
Produkce digitálních dokumentů
Dodržování standardů NK ČR - kompletní PSP balíček NDK
(METS, MODS, MIX, PREMIS, ALTO, Dublin Core)
Přebírání dat z externích systémů (Aleph, Registrdigitalizace.cz)
Kompatibilita se systémem Kramerius
Podpora identifikátorů URN:NBN, UUID
Dlouhodobá archivace digitálních dokumentů – LTP (ve vývoji)
Dodržovaní standardů pro LTP - OAIS, ISO
Propojení s Archivematicou
Dlouhodobě využíván v KNAV, SVKHK, MKP + ???
Open source založený na Fedora Commons repository
Vytváření popisných metadat
Možnosti exportu
Testovací provoz ČDK v Knihovně AV ČR
25 mil. stran
KNAV, NK, MZK, NTK
Přesun do Národní knihovny a zahájení ostrého provozu
Nutno zajistit finanční zdroje pro stabilní provoz
Smluvní ošetření mezi KNAV a NK
Smlouvy s knihovnami o spolupráci
Poskytnutí metadat, náhledů a OCR textů
Zajištění trvalých odkazů
Spolupráce s TEL a Europeanou