Top Banner
07.10.2015 Jan Vonde, intranda GmbH 1 Mehr als nur scharfe Aufnahmen: Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen Goobi Tag, 13.09.2016
37

Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

Jan 22, 2018

Download

Software

intranda GmbH
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

1

Mehr als nur scharfe Aufnahmen:Bildformate verstehen und für die richtige Verwendung inDigitalisierungsprojekten auswählenGoobi Tag, 13.09.2016

Page 2: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

2

Einleitung

Page 3: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

3

Fagestellungen

● Welche Bildformate werden im Digitalisierungsworkflow erzeugt, und zu welchem Zweck?

● Gibt es sinnvolle Alternativen?● Was ist Jpeg2000 und welche Rolle kann es in der

Digitalisierung spielen?● Wie biete ich effektiv Bildinhalte in einer

Präsentationsoberfläche an?

Page 4: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

4

Übersicht● Übersicht über die wichtigsten Bildformate

– TIFF– PNG– JPEG– JPEG2000

● Das Bild im Digitalisierungsworkflow– Archvierung– Texterkennung– Präsentation

● Bildformate im Vergleich– Datenkompression– Zugriffsgeschwindigkeit

Page 5: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

5

Übersicht über die wichtigsten Bildformate

Page 6: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

6

TIFF (Tagged Image File Format) - Baseline● Verbreitetes, bewährtes Format● Spezifikation unter Adobe-Copyright, aber viele quelloffene Implementierungen

● Schneller Zugriff● Der TIFF-Standard ist komplex (erlaubt z.B. verschiedene Kompressionsmethoden)

● Keine oder nur minimale Kompression in der Baseline-Spezifikation

● Nicht für die Anzeige in Web-Browsern geeignet● Unterstützt viele Farbräume und Farbprofile

Page 7: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

7

TIFF (Tagged Image File Format) – LZW-Kompression● LZW ist die in GIF verwendete Kompression (ehemals patentgeschützt)

● Verlustfreite Kompression● Geringe Kompressionsrate● Langsamer Zugriff

Page 8: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

8

TIFF (Tagged Image File Format) JPEG-Kompression

● Bilddaten sind mit der Jpeg-Kompression (DCT) komprimiert

● Gute, aber verlustbehaftete Kompression● Kein Jpeg!

– Teilt nicht die Einschränkungen des Jpeg-Formates, z.B Alpha-Kanal erlaubt

– Etwas größer als ein vergleichbares Jpeg– Andere Ladezeiten als ein Jpeg– Tiff Metadaten-Format

Page 9: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

9

PNG (Portable Networks Graphics)

● Offenes, einfaches Format● Verlustfreie Kompression● Geringe Kompressionsrate bei typischen Scans

– Gute Kompression bei bitonalen Bildern● Kann direkt im Browser angezeigt werden● Sehr langsamer Zugriff● Eigenes Metadatenformat (nicht Exif oder IPTC)● Unterstützt nicht alle Farbräume (kein CMYK)

Page 10: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

10

JPEG/JFIF (JPEG File Interchange Format)

● Sehr verbreitetes, inzwischen patentfreies Format● Der JPEG-Standard definiert verschiedene

Kompressionsmethoden, auch verlustfreie. Unterstützt wird jedoch in der Regel die verlustbehaftete DCT-Kompression

● Gute Kompressionsrate für typische Fotos oder Scans

● Kann direkt im Browser angezeigt werden● Schneller Zugriff● Unterstützt keinen Alpha-Kanal (Transparenz)● Begrenzte Farbtiefe

Page 11: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

11

JPEG2000 – Part 1 (JP2)

● JPEG2000 ist ein Coding-Standard, der verschiedene Bild- und Viedoformate unterstützt.– JP2: Basis-Bildformat: Sollte keine

gebührenpflichtigen Patente beinhalten– JPX: Erweitertes Bildformat– MJ2: Videoformat– JP3D: 3D-Bildformat– JPM: Format für Bildgruppen

Page 12: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

12

JPEG2000 – Part 1(JP2)

Vorteile● Hohe Kompressionsrate bei geringen

optischen Verlusten● Möglichkeit für verlustfreie

Kompression● Mehrere Qualitäts- und

Auflösungsebenen für schnellen Zugriff

● Bessere Fehlerbeständigkeit als JPEG oder TIFF

● Große Farbtiefe● Keine Größenbeschränkung● Erweiterte Kodierungsoptionen, z.B.

– Höherauflösende Regionen– Verschiedene Kompressionsmodi

für optimierten Zugriff oder bessere Bildqualität

Nachteile● Künftige Patentansprüche

können nicht ausgeschlossen werden

● Aufwändige Komprimierung und Dekomprimierung

● Geringe Softwareunterstützung

● Feine Unterschiede in der Implementierung des Standards

● Limitierte Unterstützung für Farbprofile

Page 13: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

13

Das Bild im Digitalisierungsworkflow

Page 14: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

14

Das Bild im Digitalisierungsworkflow

Physisches Objekt

Rohbild aus Scanner

Archivierung OCR Präsentation

Nachbearbeitung

Kompression

Kompression?

Page 15: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

15

Archivierung: Was brauchen wir?

● Geringer Speicherbedarf– Kompression

● Originalgetreue Wiedergabe des Objektes– Unkomprimiertes Scannerbild– Oder komprimiertes Bild ohne optische Verluste

● Langlebigkeit– Verbreitetes und offenes Datenformat– Fehlerbeständigkeit (Resistenz gegen

Pixelfehler)

Page 16: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

16

Archivierung: Lossless oder ‚visually lossless‘?Datenverlust im Digitalisierungsvorgang

Physisches Objekt

Internes Scannerbild

Ausgeliefertes Bild

Kompression?

Speicherung

Da

ten

verlu

st Spezielles, proprietäres Format des Scannerherstellers

Raw-TIFF

JP2?

Page 17: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

17

Archivierung: Lossless oder ‚visually lossless‘?Optischer Qualitätsverlust bei Kompression

Original: TIFF – unkomprimiert

JPEG: Qualität 80% (1:8.6) Qualität 30% (1:14.7)

JP2: 1:8 1:15

Page 18: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

18

Archivierung: Lossless oder ‚visually lossless‘?Auf welche Information kann ich verzichten?● JPEG und JPEG2000 werden im Frequenzraum komprimiert● Es werden also keine Bildpunkte ausgelassen sondern

Frequenzbereiche● Aber: Höhere Kompression können Artefakte erzeugen

Quelle: [7]

Page 19: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

19

OCR: Was brauchen wir?

● Geringes Datenvolumen– Daten werden mehrfach über Internetverbindungen

verschickt und auf externen Servern zwischengespeichert

– Komprimierte Bilder● Korrekte Angabe der Bildauflösung (dpi)

– Zu geringe Auflösung führt zu mehrfach berechneten OCR-Seiten

– Zu große Auflösung kann zu schlechter Schrifterkennung führen

Page 20: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

20

Presentation: Was brauchen wir?

● Hinreichend gute Qualität für die Browserdarstellung– Bilder dürfen komprimiert sein. Die benötigte Qualität richtet

sich nach der Darstellung im Browser– Browser unterstützen nur bestimmte Bildformate: Bitmap, Png,

Jpeg, Gif● Schnelle Auslieferung der Daten

– Schnell lesbares Dateiformat – keine Aufwändige Dekomprimierung

– Geringes Datenvolumen– Caching

● Geringer Speicherverbrauch– Komprimierung– Geringere Auflösung

Page 21: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

21

Präsentation: Wie kommt das Bild zum Betrachter?

Auslieferung eines Bildes an einen Internet-Browser

●als Bildpyramide●als Originalbild●als gekacheltes Bild

Page 22: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

22

Ausliefern einer Bildpyramide

Dateisystem

Verkleinern

Browser

WWW

Format-Konvertierung

Content-Server

TIFF

JPEG

Page 23: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

23

Ausliefern des originalen Datenstroms

Dateisystem

Browser

WWW

Content-Server

PNG

PNG

Page 24: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

24

Ausliefern eines gekachelten Bildes

Dateisystem

Verkleinern

Browser

WWW

Format-Konvertierung

Content-Server

TIFF

Ausschneiden

JPEG

Page 25: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

25

Bildformate im Vergleich

Page 26: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

26

Größenverhältnisse der Formate

TIFF-Raw TIFF-LZW PNG JP2 (lossless) TIFF-JPEG (92%) JPEG (92%) JP2 (1:20)0

10

20

30

40

50

60

RGB

Grayscale

Bitonal

Page 27: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

27

Auslieferungszeit von Bildern:Vollständige Farbbilder – niedrige Auflösung

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

1

2

3

4

5

6

7

8

9

10

Karte/w=500px

Karte/w=500px/Subsampling

Lad

ezei

t [s]

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Buch/w=500px

Buch/w=500px/Subsampling

Lad

ezei

t [s]

Page 28: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

28

Auslieferungszeit von Bildern:Vollständige Farbbilder – hohe Auflösung

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

Buch/w=3000px

Buch/w=3000px/SubsamplingLad

ezei

t [s]

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

2

4

6

8

10

12

14

16

18

20

Karte/w=3000px

Karte/w=3000px/Subsampling

Lad

ezei

t [s]

Page 29: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

29

Auslieferungszeit von Bildern:Vollständige schwarz/weiß Bilder

TIFF-raw TIFF-LZW PNG JPEG0

0.05

0.1

0.15

0.2

0.25

0.3

Buch/w=3000px

Buch/w=3000px/Subsampling

Lad

ezei

t [s]

TIFF-raw TIFF-LZW PNG JPEG0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Buch/w=500px

Buch/w=500px/Subsampling

Lad

ezei

t [s]

Page 30: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

30

Auslieferungszeit von Bildern:Farbbilder – Kacheln

TIFF-raw TIFF-LZW PNG TIFF-JPEG JPEG JP20

0.5

1

1.5

2

2.5

3

3.5

4

4.5

5

512x512px/1:1

4096x4096px/1:8

Lad

ezei

t [s]

Page 31: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

31

SubsamplingZum schnelleren Lesen einer Datei werden in regelmäßigen Abständen Pixel übersprungen→ erhebliche Zeitersparnis beim Einlesen und Skalieren→ Erzeugt deutliche Artefakte

Quelle: Die digitale Landesbibliothek Oberösterreich, http://digi.landesbibliothek.at/viewer/

Page 32: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

32

Fazit

Page 33: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

33

Archivierung: Perspektiven für Jpeg2000 und mögliche Alternativen

● TIFF bleibt das verlässlichste Archivierungsformat, wenn Speicherbeschränkung keine wesentliche Rolle spielt

● Jpeg2000 bietet effektive Möglichkeiten– Zur Datenkompression– Zum Datenzugriff

● Jpeg2000 hat wesentliche Einschränkungen– Mangel an verlässlichen offenen Implementierungen– Komplexität des Standards und der Implementierung

● Ist verlustbehaftete Kompression eine Alternative bei teurem Speicherplatz in der Langzeitarchivierung?

● PNG bietet ein offenes und verbreitetes Format mit verlustfreier Kompression. Ist dies eine Alternative zum unkomprimierten TIFF?

Page 34: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

34

Präsentation: Die Inhalte bestimmen das geeignete Format

● TIFF/JPEG bietet insgesamt den besten Zugriff auf Inhalte● JPEG oder PNG können als schnelle Darstellungsformate für

bestimmte Inhalte dienen– Bitonale Bilder: PNG– Thumbnails: JPEG

● Techniken wie Kachelung und Subsampling können die Zugriff auf Inhalte beschleunigen

● Jpeg2000 bietet großes Potential für– Datenkompression– Zugriffsgeschwindigkeit– Bildqualität

● Aktuelle offene Implementierungen können dieses Potential noch nicht effektiv nutzen

Page 35: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

35

Fragen/Bemerkungen?

Page 36: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

36

Danke :)

Page 37: Mehr als nur scharfe Aufnahmen - Bildformate verstehen und für die richtige Verwendung in Digitalisierungsprojekten auswählen

07.1

0.20

15Ja

n Vo

nde,

intr

anda

Gm

bH

37

Quellen1) Adobe: Developer/TIFF

http://partners.adobe.com/public/developer/tiff/index.html2) Aware Systems: TIFF, Tag Image File Format, FAQ

http://www.awaresystems.be/imaging/tiff/faq.html3) Aleks Jakulin: Baseline JPEG and JPEG2000 Artifacts Illustrated

http://www.stat.columbia.edu/~jakulin/jpeg/artifacts.htm4) Johan van der Knijff: Ensuring the suitability of JPEG 2000 for preservation, 2010

http://blog.wellcomelibrary.org/2010/12/guest-post-ensuring-the-suitability-of-jpeg-2000-for-preservation/5) Johan van der Knijff: ICC profiles and resolution in JP2: update on 2011 D-Lib paper, 2013

http://openpreservation.org/blog/2013/07/01/icc-profiles-and-resolution-jp2-update-2011-d-lib-paper/6) Joint Photographic Experts Group: Overview of JPEG 2000

https://jpeg.org/jpeg2000/index.html7) Paolo Buonora/Franco Liberati: A Format for Digital Preservation of Images - A Study on JPEG 2000

File Robustnesshttp://www.dlib.org/dlib/july08/buonora/07buonora.html

8) Joint Photographic Experts Group: Overview of JPEGhttp://jpeg.org/jpeg/

9) Eric Hamilton: JPEG File Interchange Format, 1992http://www.w3.org/Graphics/JPEG/jfif3.pdf

10)Wikipedia: Portable Network Graphicshttp://en.wikipedia.org/wiki/Portable_Network_Graphics