Formaty hybrydowe Formaty hybrydowe w bibliotekach cyfrowych w bibliotekach cyfrowych W. M. Kolasa Wojewódzka Biblioteka Publiczna w Krakowie (kontekst i praktyka) Konferencja „Praktyczne aspekty tworzenia bibliotek cyfrowych”. Wojewódzka Biblioteka Publiczna w Krakowie, 12.09.2008
151
Embed
W. M. Kolasa - eprints.rclis.orgeprints.rclis.org/16500/1/kolasa_formaty_hybrydowe_dist.pdf · akustycznych i graficznych, inne komunikaty graficzne jak obrazy, wykresy, animacje,
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Formaty hybrydowe Formaty hybrydowe w bibliotekach cyfrowychw bibliotekach cyfrowych
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
(kontekst i praktyka)
Konferencja „Praktyczne aspekty tworzenia bibliotek cyfrowych”. Wojewódzka Biblioteka Publiczna w Krakowie, 12.09.2008
Plan wyk�aduPlan wyk�adu –– cz. 1 z 3cz. 1 z 31. Dokument elektroniczny i jego konteksty
• Kontekst normatywny
• Kontekst praktyczny
2. Typologia formatów
• Formaty w cyklu tworzenia publikacji cyfrowej
• Formaty archiwalne
• Formaty prezencyjne
3. Formaty hybrydowe
• Portable Document Format
• DJVu, inneW. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Dokument elektroniczny Dokument elektroniczny w sensie normatywnymw sensie normatywnym
• Definicje prawne
• Normy
• Cechy DE
• Struktura DE
• Co to jest format?
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
DEDE –– prawo i normyprawo i normy- ISO 15489 (mi�dzynarodowe)- Model of Requirements for Records
Management (UE)Polska:
- PN-ISO 15489-1:2006 i in.
- Ustawa o informatyzacji ... (Dz.U. 2005 nr 64, poz. 565),
- Ustawa o �wiadczeniu us�ug drog� elektroniczn�(Dz.U. 2002 nr 144, poz. 1204)
- Ustawa o podpisie elektronicznym (Dz.U. 2001 nr 130, poz. 1450)
- Kodeks Karny
Wojewódzka Biblioteka Publiczna w Krakowie
Definicje DE (1)Definicje DE (1)DE (komputerowy, cyfrowy) - dokument z sygna�emutrwalonym na no�niku elektronicznym. Mog� to by�komunikaty ró�nych j�zyków naturalnych w subkodachakustycznych i graficznych, inne komunikaty graficzne jak obrazy, wykresy, animacje, filmy, komunikaty d�wi�kowe, np. muzyka (S�ownik encyklopedyczny informacji, j�zyków i systemów... Warszawa 2002)
DE - zbiór danych wprowadzonych lub przechowywanychna dowolnym no�niku przez system informatyczny lub podobny uk�ad, które mog� by� odczytane lub wy�wietlone przez osob� lub przez tego rodzaju system lub uk�ad, a tak�e wszelkiego rodzaju prezentacja i wszelkiego rodzaju przedstawienie tych danych w formie drukowanej lub innej (Decyzja KE, 2004/563/WE)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Definicje DE (2)Definicje DE (2)DE - „dokument istniej�cy w postaci elektronicznej, dost�pny za po�rednictwem techniki komputerowej” (PN-ISO 690-2)
DE - „stanowi�cy odr�bn� ca�o�� znaczeniow� zbiór danych uporz�dkowanych w okre�lonej strukturze wewn�trznej i zapisany na informatycznym no�nikudanych(Ustawa o informatyzacji... 2005)
DE - „ka�dy przedmiot lub zapis na komputerowym no�niku informacji, z którym jest wi�zane okre�loneprawo albo który ze wzgl�du na zawart� w nim tre��stanowi dowód prawa, stosunku prawnego lub okoliczno�ci maj�cej znaczenie prawne” (Kodeks Karny)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Prace nad terminologi�Prace nad terminologi�Ustawa o zmianie ustaw w celu ujednolicenia terminologii informatycznej (w toku – skier. do podpisu Prezydenta - 5.09.2008)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
W �wietle PNW �wietle PN--ISO 690ISO 690--22
DE – [...] dokument istniej�cy w postaci elektronicznej, dost�pny za po�rednictwemtechniki komputerowej [...]
• posta�
• medium
PN-ISO 690-2 Informacja i dokumentacja - Zarz�dzanie dokumentami
Wojewódzka Biblioteka Publiczna w Krakowie
DEDE -- cechycechy1. Utrwalone na materialnym no�niku;
2. Mo�na je odtwarza� w formie umo�liwiaj�cej ich percepcj�;
- Nie jest istotny rodzaj no�nika i sposób transmisji;
- istotne za� jest, aby dane mog�y by� wielokrotnieodtwarzane.
Wojewódzka Biblioteka Publiczna w Krakowie
DEDE -- wyró�nikiwyró�niki1. Zawarto�� – tekst, obraz, d�wi�k i in.;
2. Struktura logiczna, która nie musi by� to�sama ze struktur� fizyczn�, gdy� mo�e by� zawartabezpo�rednio w dokumencie, w bazie danych lubpliku zewn�trznym;
3. Kontekst, czyli metadane techniczne okre�laj�ce w jakiej postaci dokument b�dzie prezentowany.
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Struktura DEStruktura DEStruktura logiczna dokumentu elektronicznego - sposób u�o�enia informacji w dokumencie elektronicznym zdefiniowany poprzez okre�lenie elementów informacyjnych oraz powi�za� mi�dzy nimi;
Struktura fizyczna dokumentu elektronicznego – wynik przetworzenia, w tym kodowania i szyfrowania, informacji zawartych w dokumencie elektronicznym na dane w uk�adzie bitowym (czyli format danychformat danych);
Rozporz�dzenie Prezesa Rady Ministrów z dnia 29 wrze�nia 2005 r. w sprawie warunków organizacyjno-technicznych dor�czania dokumentów elektronicznych podmiotom publicznym (Dz.U. 2005, nr 200, poz. 1651)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Dokument elektroniczny Dokument elektroniczny w sensie praktycznymw sensie praktycznym
• Rozumienie DE w bibliotece cyfrowej
• Oczekiwania wobec publikacji w bibliotece cyfrowej
• Porównanie procesu tworzenia publikacji tradycyjnej i elektronicznej
• Konsekwencje dla bibliotek
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
DEDE w sensie praktycznymw sensie praktycznymZ punktu widzenia bibliotek cyfrowych obecnej generacji w�a�ciwsze jest operowanie poj�ciem publikacji cyfrowej, któr� nale�y traktowa� w�sko:
... to ksi��ka tradycyjna na no�niku elektronicznym
Podobny lub identyczny:
� proces tworzenia
� proces redakcji, recenzowania
� proces sk�adu
Wojewódzka Biblioteka Publiczna w Krakowie
Oczekiwania czytelników Oczekiwania czytelników Format zapisu e-ksi��ki winien oferowa� takie parametry, aby higiena jej czytania by�a nie gorsza ni� ksi��kitradycyjnej.
600 DPI
24 BPP
djvu
6283x9094 pikseli
280 kB
Wojewódzka Biblioteka Publiczna w Krakowie
Warto�� dodana Warto�� dodana -- ZOOMZOOMWojewódzka Biblioteka Publiczna w Krakowie
Z my�l� o przysz�o�ciZ my�l� o przysz�o�ci
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Ile cali b�dzie mia�monitorprzysz�o�ci?
Warto�� dodana Warto�� dodana -- OCROCRWojewódzka Biblioteka Publiczna w Krakowie
Ksi��ka tradycyjna a eKsi��ka tradycyjna a e--ksi��kaksi��ka
Autor
Recenzent
Redakcja
DTP
PDF
Przygotowanie
Przygotowanie
Maszynydrukarskie
Bibliotekacyfrowa
+ metadane
Ksi��ka wspó�czesna (druk cyfrowy)
Ksi��ka tradycyjna
e-Ksi��ka
Wojewódzka Biblioteka Publiczna w Krakowie
Ksi��ka tradycyjna a eKsi��ka tradycyjna a e--ksi��kaksi��ka
Autor
Recenzent?
Redakcja?
DTP?Przygotowanie Biblioteka
cyfrowa
+ metadaneSkanowanie TIFF
Ksi��ka dawna lub drukowana z u�yciem klisz
Wojewódzka Biblioteka Publiczna w Krakowie
Biblioteka cyfr. Biblioteka cyfr. –– nowe zadanianowe zadania• Funkcje typowe dla drukarni:
• przetwarzanie sk�adu;
• montowanie publikacji;
• skanowanie, konwersja;
• Funkcje typowe dla wydawców:
• umowy licencyjne;
• regulacja praw autorskich;
• dora�na redakcja i sk�ad DTP;
• Funkcje typowe dla firm hostingowych:
• utrzymanie w ruchu infrastruktury serwerów i ��czy.
Wojewódzka Biblioteka Publiczna w Krakowie
Plan wyk�aduPlan wyk�adu –– cz. 2 z 3cz. 2 z 31. Dokument elektroniczny i jego konteksty
• Kontekst normatywny
• Kontekst praktyczny
2. Typologia formatów
• Formaty w cyklu tworzenia publikacji cyfrowej
• Formaty archiwalne
• Formaty prezencyjne
3. Formaty hybrydowe
• Portable Document Format
• DJVu, inneW. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Formaty dokumentówFormaty dokumentów• Formaty w cyklu tworzenia publikacji cyfrowej
• O etapach cyklu
• Ogólna typologia formatów
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Cykl tworzenia PC a formatyCykl tworzenia PC a formaty1. Przygotowanie materia�ów do digitalizacji
3. PDF – jako format prezencyjnyprezencyjny- ale po wyrafinowanych zabiegach adaptacyjnych.
4. PDF – w pe�ni poprawnie funkcjonuje tylko na oprogramowaniu Adobe.
5. Mog� istnie� problemy prawne (por. licencje EULA).
6. PDF – format bardzo z�o�ony, ��czy: tekst, grafik�rastrowa i wektorow� oraz elementy aplikacyjne.
Wojewódzka Biblioteka Publiczna w Krakowie
PDF (w poligrafii i nie tylko)PDF (w poligrafii i nie tylko)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
PDFPDF -- narz�dzianarz�dzia
W. M. Kolasa
1. Adobe Acrobat - edytor (komercyjny)*
2. Brak godnych polecenia edytorów bezp�atnych;
3. Liczne przegl�darki (na czele z Adobe Reader);
4. Liczne drukarki wirtualne (z regu�y bezp�atne) lub wbudowane w aplikacje (np. MS Office, AutoCad);
5. Liczne narz�dzia do manipulacji na plikach PDF;
6. Poza Adobe Acrobatem wszystkie narz�dza oferuj�tylko pewien poziom obs�ugi formatu PDF (skutkuje to z�� jako�ci�, rozmiarem, niepoprawnymi parametrami).
* Nadto inne specjalistyczne stosowane w poligrafii
Wojewódzka Biblioteka Publiczna w Krakowie
Adobe AcrobatAdobe Acrobat 8.0 Prof. (9.0)8.0 Prof. (9.0)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Adobe Acrobat Adobe Acrobat –– wybrane funkcjewybrane funkcje- mo�liwo�� manipulacji na danych (uk�ad, grafika,
tekst, czcionki, parametry obiektów itp.);
- mo�liwo�� importu dowolnych danych;
- mo�liwo�� dodania warstwy OCR*;
- zabezpieczenia; metadane;
- narz�dza do edycji i optymalizacjioptymalizacji;
- formularze, komentarze,
- liczne opcje eksportu;
- narz�dzia kontroli i inspekcji.
* Niska jako�� wbudowanego engine OCR
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
PDFPDF –– (zaimportowany TIF)(zaimportowany TIF)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
PDFPDF –– obiekt tekstowoobiekt tekstowo--graficznygraficzny
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
PDFPDF –– osadzoneosadzone matadanematadane
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
PDFPDF –– osadzonyosadzony DublinCoreDublinCore
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
OptymalizacjaOptymalizacja –– zawsze potrzebnazawsze potrzebna
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
PDFPDF –– wirtualne drukarkiwirtualne drukarki
W. M. Kolasa
Mimo szerokiej oferty programów – tylko nieliczne dzia�aj� w pe�ni poprawnie:
1. Narz�dzia oparte na silniku Adobe:
• Acrobat Distiller i kontrolki Adobe (InDesign i in.)
• Wtyczki do popularnych programów (Word, Corel, AutoCad)
2. Niektóre programy oparte na GPL/AFPL GhostScript:
• PDF Creator*;
• Wtyczki do OpenOffice i GoogleDoc.
3. Uniksowe narz�dzia do PostScriptu.* Drobne b��dy
DJVuLibreDJVuLibre –– djvuseddjvused [edytor][edytor]• Fragment strony pomocy:
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Parametr:Parametr:
---- setset--txttxt [djvusedtxtfile]
Insert hidden text information into the selected pages. The optionalargument djvusedtxtfile names a file containing the hidden text information.This file must contain data similar to what is produced by command print-txt. When the optional argument is omitted, the program reads the hidden text information from the djvused script until reaching an end-of-file or aline containing a single period.
....
Jak wykona� djvu i OCR z 72 Jak wykona� djvu i OCR z 72 dpidpi??
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Jak wykona� djvu i OCR z 72 Jak wykona� djvu i OCR z 72 dpidpi??
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
DJVuDJVu –– rozwi�zanierozwi�zanie serweroweserwerowe1. Infrastruktura oparta na Document Express Enterprise
wraz z elementami dedykowanymi – komercyjne
2. Infrastruktura wykorzystuj�ca równolegle DocumentExpress Prof. i komponenty bezp�atne na platform�linuksa (DJVuLibre, Tesseract, ImageMagick, pdftk).
3. Jak 2. – ale zamiast Tesseracta u�ywany jest Abbyy FineReader (komercyjny).
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
DJVuDJVu –– serw. rozwi�zanie 2serw. rozwi�zanie 2--331. Dwie metody tworzenia djvu:
• na platformie linuksa – wówczas jedynie kopiujemypdf lub tif na serwer (DJVuLibre lub pdf2djvu);
• wykonane w aplikacjach windows – w tym przypadku kopiujemy na serwer pliki djvu do dalszej obróbki;
2. Przed OCR. eksport djvu do TIFF (ddjvu);
3. OCR (Tesseract lub FineReader);
4. Osadzanie tekstu z djvu (djvused)
5. Czynno�ci ko�cowe: miniatury jpg, thumb, rozdzielnie6. Kopiowanie gotowych katalogów z serwera na udzia�y samby.
Inne formaty: Inne formaty: TeXTeXNatywne formaty prezencyjne TeX, Latex – popularne w
kr�gach matematyków, fizyków i in�ynierów (*.dvi)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
Inne formaty: postscriptInne formaty: postscriptPostScript - niezale�nym od urz�dzenia wyj�ciowego
j�zykiem programowania, który opisuje tekst i grafik� na stronie.
Jego polecenia steruj� drukark� laserow� (lub dowolnyminnym urz�dzeniem postscriptowym), umieszczaj�c w odpowiednim miejscu lini�, okr�g, tekst czy te� map�bitow�.
Do odczytu plików Postscriptowych (*.ps) mo�na u�y�programu GhostScript (GSview)
W. M. Kolasa
Wojewódzka Biblioteka Publiczna w Krakowie
ZoomifyZoomify EZ,EZ, Google Maps Google Maps Wojewódzka Biblioteka Publiczna w Krakowie
Inteligentna forma prezentacji jpg (ci�cie, scalanie)
ZoomifyZoomify (z(z PhotoshopemPhotoshopem))Wojewódzka Biblioteka Publiczna w Krakowie