Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V. 1. DGI-Konferenz, 62. DGI Jahrestagung Semantic Web & Linked Data Elemente zukünftiger Informationsinfrastrukturen MODS2FRBRoo Ein Tool zur Anbindung von bibliographischen Daten an eine Ontologie für Begriffe und Informationen im Bereich des kulturellen Erbes
27
Embed
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Ontologie für Begriffe und Informationen im Bereich des kulturellen Erbes
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
1. DGI-Konferenz, 62. DGI JahrestagungSemantic Web & Linked Data
Elemente zukünftiger Informationsinfrastrukturen
MODS2FRBRoo
Ein Tool zur Anbindung von bibliographischen
Daten an eine Ontologie für Begriffe und
Informationen im Bereich des kulturellen Erbes
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Agenda
• Motivation
– DFG-Projekt „ArcheoInf“
– CIDOC CRM und die Rolle als Referenzontologie
• CIDOC CRM + FRBR = FRBRoo
– Modell der „physikalischen“ Objekte
• RDA
– Modell der „biologischen“ Objekte
• Der Konverter
– Technik
– Ergebnisse
• Ausblick
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Motivation
• DFG-Projekt „ArcheoInf“ seit 2007
• Ziel:„ein Informationsnetz zur Bereitstellung von digitalen Forschungsdaten archäologischer Feldprojekte (Ausgrabungen, Surveys) sowie eine darauf zugeschnittene Serviceumgebung zu schaffen“
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Motivation
• Hohe Komplexität der Daten erwartet
• => ontologische Betrachtung der
Informationen
• => größtmögliche Flexibilität bei der
Datenstrukturierung
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
ArcheoInf
• Modell der Forschungsdaten (Stand Anfang 2010)
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
CIDOC CRM
• „Das CIDOC Conceptual Reference Model bietet die erweiterbare Ontologiefür Begriffe und Informationen im Bereich des Kulturerbes. Es ist eine Norm (ISO 21127:2006) für den kontrollierten Austausch von Informationen im Bereich des kulturellen Erbes und soll unter anderem von Archiven, Bibliotheken und Museen zur Verbesserung der Verfügbarkeit von Wissen angewandt werden.
• Es ist das Ziel des CIDOC CRM, die vielfältigen Informationen im Bereich des kulturellen Erbes gemeinsam zu erfassen und einen allgemeinen Rahmen ihrer formalen Semantik zur Verfügung zu stellen, damit jede Information dieses Bereichs den Begriffen des CIDOC CRM zugeordnet werden kann. Auf diese Weise werden wichtige Voraussetzungen für die Informationsintegration geschaffen, da auf der Grundlage des CIDOC CRM Werkzeuge zur Schematransformation und -integration entwickelt werden können.“
• Seite „CIDOC Conceptual Reference Model“. In: Wikipedia, Die freie Enzyklopädie. Bearbeitungsstand: 4. Februar 2010,
20:53 UTC. URL: http://de.wikipedia.org/w/index.php?title=CIDOC_Conceptual_Reference_Model&oldid=70245933
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
CIDOC CRM
• … ist ereignisorientiert
Crofts,N., Doerr, M. and Gill, T "The CIDOC Conceptual Reference Model: A standard for communicating cultural contents",
Cultivate Interactive, issue 9, 7 February 2003. URL: http://www.cultivate-int.org/issue9/chios/
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
ArcheoInf + CIDOC CRM
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Bibliographische
Informationen
• Datenbanken enthalten
Literaturangaben
• Quantitativ und qualitativ sehr
heterogen
• Bezüge zu den Forschungsdaten
• => Anbindung ans Modell der
Forschungsdaten via FRBRoo
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
FRBR + CRM = FRBRoo
• Functional Requirements for
Bibliographic Records (FRBR, 1998)
• Erweiterung des CRM durch FRBR
ergab FRBRoo
• Dabei: Präzisierung der FRBR-
Entitäten
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Publikationstypen
• … nach
Gantert/Hacker (2008)
• Feinere Entitäten des
Works in FRBRoo
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
„physikalisches Modell“
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
RDA- Resource Description
and Access
• Erschienen Sommer 2010
• Neues Regelwerk basierend auf den
FRBR/FRAD(/FRSAD)
– Definition von Merkmalen und
Beziehungen für/zwischen Entitäten
– Regeln für Merkmalen
– Regeln für die Beziehungen
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
RDA – Ein Beispiel
H. Wiesenmüller, 2010
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
„biologisches Modell“
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Der Konverter
• ArcheoInf:
bib. Daten Citavi MODS
• Aufgabe:
MODS FRBRoo-kompatibles RDF
• Vorhanden:
– RDF-Darst. des CIDOC CRM v5.0.1
– RDF-Darst. der RDA
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
<xsl:if test="genre[@authority='local']='Contribution' or
genre[@authority='local']='JournalArticle'">
[...]
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Der Algorithmus – Schritt 2
• Zusammenfassen von „gleiche“
Personen und Körperschaften
• Kriterium: gleiche Zeichenketten
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Der Algorithmus – Schritt 3
• Ersetzen der „alten URIs“ für
Personen und Körperschaften durch
neue URIs
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Der Algorithmus – Was fehlt?
• Autom. FRBRisierung der Entitäten
der Gruppe 1: Work, Expression,
Manifestation, Item
• Grund: fehlende eindeutige Kriterien
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Ergebnisse
• RDF verifiziert und in Triple Store
„Sesame“ eingespielt
• Abfragen möglich mit sinnvollen
Ergebnissen
• Aber:
– Laufzeit ok
– Bedarf an Arbeitsspeicher: sehr hoch
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.
Ausblick
• Modell
– Verbindung der Forschungs- und
bibliographischen Daten durch
sacherschließende Relationen
– Optimierung der Merkmale/Attribute
• Technisch
– XSLT-Konverter vs. Speicherbedarf
Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis e.V.