13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 1 Heidrun Wiesenmüller Hochschule der Medien Anreichern, abgleichen, verknüpfen Anwendungsideen für das Werk-Clustering (Beitrag im Workshop „Anwendung von Clustering-Verfahren zur Verbesserung und Analyse von Katalogdaten“)
60
Embed
Heidrun Wiesenmüller: Anreichern, abgleichen, verknüpfen - Anwendungsideen für das Werk-Clustering
Vortrag "Anreichern, abgleichen, verknüpfen" von Heidrun Wiesenmüller auf dem Workshop "Anwendung von Clustering-Verfahren zur Verbesserung und Analyse von Katalogdaten" (gemeinsam mit Magnus Pfeffer) beim Leipziger Bibliothekskongress 2013.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 1
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
n
Anreichern, abgleichen,
verknüpfen
Anwendungsideen
für das Werk-Clustering
(Beitrag im Workshop „Anwendung von
Clustering-Verfahren zur Verbesserung und
Analyse von Katalogdaten“)
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 2
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
n
1. Individualisierung
2. Differenzierung von Normsätzen
3. Maschinell erstellte Werk-Normsätze
4. Optimierungspotenziale für das Clustering
Agenda
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 3
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
n
1. Individualisierung
2. Differenzierung von Normsätzen
3. Maschinell erstellte Werk-Normsätze
4. Optimierungspotenziale für das Clustering
Agenda
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 4
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
nIndividualisierung von Personen
• in angloamerikanischer Welt schon immer üblich
Lebensdaten sind sogar Teil der Ansetzungsform
• von RAK ursprünglich nicht vorgesehen
in deutschsprachigem Raum erst seit einigen Jahren
praktiziert
• erheblicher Aufwand für die Erschließung
Differenzieren von Autoren, Erfassen zusätzlicher
Informationen, Bearbeiten von Altdaten (z.B. Auflösen
von „Sammeltöpfen“)
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 5
Beispiel für Individualisierung
dreimal „Heiner Müller“
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 6
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
nProbleme bei Individualisierung
• Altdaten
bisher nur zum Teil aufgearbeitet
• Informationen nicht ausreichend bzw. gesichert
Individualisierung z.T. anhand der vorliegenden Angaben
nicht möglich, Zuordnen zu vorhandenen Datensätzen oft
schwierig, keine Zeit für zusätzliche Recherchen
• Verzicht auf Individualisierung
aus unterschiedlichen Gründen (z.B. keine Zeit,
mangelnde Erfahrung mit GND bei kleinen Bibliotheken)
• ohne manuelle Bearbeitung eingespielte Fremddaten
z.B. E-Book-Pakete, Daten für Nationallizenzen
(oft ganz ohne Verknüpfung zu Personensätzen)
bisher noch sehr unvollkommen umgesetzt
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 7
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
nChance für Werk-Clustering
• Verfasser auf Werk-Ebene angesiedelt
auch bei Herausgebern von Aufsatzbänden u.ä. möglich
• ein einziger Datensatz aus dem Cluster genügt
wenn in irgendeinem Verbund eine Ausgabe mit einem
individualisierten Satz verknüpft ist, kann dies für alle
anderen Mitglieder im Cluster übernommen werden
• kann auch zum Auffinden von Fehlern dienen
z.B. könnte nach Fällen gesucht werden, in denen zwei
Mitglieder desselben Clusters mit unterschiedlichen
individualisierten Personensätzen verknüpft sind
• Einbezug angloamerikanischer Daten
könnte die Ergebnisse weiter verbessern
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 8
SWB
GBV
• SWB: nicht individualisiert
• GBV: individualisiert
(ebenso DNB und HBZ)
GND-Satz
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 9
GBV
• SWB: individualisiert
• GBV: nicht indiv. (so
auch HBZ und OBV)
SWB
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 10
SWB
• SWB: nur Online-Ausgabe, dort nicht individualisiert
(so auch im GBV und OBV)
• Daten von E-Book-Paketen
werden häufig eingekauft und ohne intellektuelle Nach-
bearbeitung eingespielt
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 11
• HBZ: nur Druck-Ausgabe,
dort Tp-Satz
HBZ
• HBZ:
nur Druck-Ausg.,
dort individualisiert
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 12
GBV
im selben Verbund:
E-Book-Ausgabe ohne
Individualisierung,
Druckausgabe mit!
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 13
GBV
Variante:
E-Book-Ausgabe steht
nicht unter Ansetzungs-
form, sondern unter
einer Verweisungsform
(im Tp-Satz enthalten)
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 14
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
n
SWB:
Titel dieser Person sind
auf nicht weniger als
drei Normsätze verteilt
13.03.2013 5. Kongress Bibliothek & Information Deutschland Folie 15
Heid
run W
iesenm
ülle
r
H
ochschule
der
Medie
n
• bisher manuelle Bearbeitung
sehr aufwendig, im laufenden Betrieb kaum zu leisten