DataCite DOIs, Services und Kooperationen 12.01.2016 Jan Brase, Britta Dreyer, Brigitte Hausstein, Birte Lindstädt „Datenpublikationen mit DOIs – persistent und zitierbar“ DataCite / Helmholtz Open Science Workshop
DataCiteDOIs, Services und Kooperationen
12.01.2016Jan Brase, Britta Dreyer, Brigitte Hausstein, Birte Lindstädt
„Datenpublikationen mit DOIs – persistent und zitierbar“ DataCite / Helmholtz Open Science Workshop
Warum Forschungsdaten publizieren?
• Transparenz und Nachprüfbarkeit der Forschungsergebnisse• Nachnutzung in neuen Kontexten• Vermeidung von Doppelarbeit• Sichtbarkeit der Daten → wissenschaftliche Reputation durch
Zitationen• Erfüllung der Anforderungen von Fördereinrichtungen wie DFG und
EU oder der eigenen Institution• Leitlinien zum Umgang mit Forschungsdaten (DFG)• Open Data Pilot, Horizon 2020
2
Probleme
• Forschungsdaten sind nach wie vor größtenteils nicht öffentlich zugänglich
• Forschungsdaten werden nicht oder uneinheitlich mit Metadaten beschrieben
• Für das Referenzieren und Zitieren von Forschungsdaten hat sich bisher kein Standard durchgesetzt
• „Widerstand“ bzw. wenig Bewusstsein bei den Forschenden
3
Forschungsdatenmanagement
• Maßnahmen zur Sicherstellung der Nutzbarkeit von Forschungsdaten− für eigene/gemeinsame Nutzung im wissenschaftlichen
Arbeitsprozess− für eine Nachnutzung − als Dokumentation der korrekten wissenschaftlichen
Arbeitsweise− für die Archivierung
• Ziele definieren − Qualitätssicherung− Replizierbarkeit− Nachnutzbarkeit
• Data Management Pläne als Instrument4
Lebenszyklus von Forschungsdaten
5
Jens Ludwig, Harry Enke (Hrsg.): Leitfaden zum Forschungsdaten-Management. 2013
Übergreifende Aufgaben
6
Jens Ludwig, Harry Enke (Hrsg.): Leitfaden zum Forschungsdaten-Management. 2013
7
• DOI als persistenter Identifikator verweist auf das Objekt selbst, ein DOI-Name bleibt unabhängig von URL-Änderungen gültig
• DOI-Namen sind zitierfähig
• DOI-Namen können in jedem Handleserver weltweit aufgelöst werden, ohne Kenntnis der Vergabeinstitution
• Weltweit bereits über 120 Mio. DOI-Namen vergeben, ein Großteil davon für elektronische Versionen von Zeitschriftenartikeln
DOI Resolving
8
• 1998 Gründung der International DOI Foundation (IDF) als übergeordnete Organisation
• Derzeit 9 Registrierungsagenturen• Das IDF System garantiert vertrauenswürdige
Verantwortlichkeiten, einheitliche Standards und Workflows
• DOI ist eine geschützte Marke• DOI ist eine Vermarktung des technisch geprägten
Handle Systems• Mai 2012: Das DOI-System ist ISO Standard 26324• DOI steht für Publikation (Zitierfähigkeit, Nachhaltigkeit)
DOI-Registrierung
9
DOI-Registrierungsagenturen
• CrossRef – Zeitschriftenartikel, Bücher, Konferenzberichte• DataCite – Forschungsdaten, graue Literatur, nicht-textuelle Materialien• EIDR – Filme, TV-Serien und andere kommerzielle Filmmaterialien
• Airiti, Inc. – Traditionelle chinesische Materialien• CNKI (China National Knowledge Infrastructure) – Chinesische e-Journals,
Zeitungen, Dissertationen, Konferenzbände etc.• ISTIC (The Institute of Scientific and Technical Information of China) –
Zeitschriften des chinesischen Marktes• JaLC (Japan Link Center) – wissenschaftliche und akademische
Publikationen in Japan• mEDRA (multilingual European DOI Registration Agency) – Internet-
Dokumente
• OP (Publications Office of the European Union) – Dokumente der Europäischen Union
10
• 2003:DFG Projekt der TIB mit World DataCenters bzgl. Publikation von Forschungsdaten
• 2005:TIB wird erste DOI-Registrierungsagentur für Forschungsdaten. Von Anfang an wird auch graue Literatur registriert.
• 03/2009:Paris Memorandum bzgl. der Zusammenarbeit von 6 europäischen Informationseinrichtungen
• 12/2009:Gründung von DataCite mit 7 Mitgliedern
Historie von DataCite
11
• Globales Konsortium getragen von lokalen Einrichtungen• Fokus: Verbesserung des Zugangs zu und der Zitierung von
Daten und anderen nicht-textuellen Inhalten• In Kooperation mit Datenzentren und anderen Einrichtungen,
die Daten vorhalten• Auf dem DOI-System basierend mit Überlegungen andere
Persitent Identifier (PID) aufzunehmen• Gegründet am 1. Dezember 2009 in London• Aktuell 24 Mitglieder + 8 assoziierte Mitglieder (2015) aus 19
Ländern; 27 Mitglieder + 8 assoziierte Mitglieder (2016)
DataCite
12
ANDS – Australian National Data ServiceBIBSYS, NorwayBritish LibraryCalifornia Digital LibraryCERN – European Organization for Nuclear ResearchCRUI – Conference of Italian University Rectors ETH Zürich, SwitzerlandGesis, GermanyINIST-CRNS – Institute for Scientific and Technical Information, FranceJaLC – Japan Link CenterHungarian Academy of Sciences Library and Information Centre NRC-CISTI – National Research Council Canada / Canada Institute for Scientific and Technical InformationNRCT – National Research Council of Thailand OSTI – Office of Scientific and Technical Information, USAPurdue University Libraries, USASAEON – South African Environmental Observation NetworkSwedish National Data Service SUB Göttingen, GermanyTechnical Information Center of DenmarkTIB, GermanyTU Delft Library, The NetherlandsUniversity of Tartu, EstoniaZB MED, GermanyZBW, Germany
DataCite MitgliederNeue Mitglieder 2016
CSIC - Spanish National Research Council FAO – Food and Agriculture Organisation of the United Nations, ItalySPbSTU - Peter the Great St.Petersburg Polytechnic University
Affiliated members
Digital Curation Center, UKMicrosoft Research, USAICPSR – Interuniversity Consortium forPolitical and Social Research, USAKISTI – Korea Institute of Science and Technology InformationBGI – Beijing Genomic Institute, ChinaIEEE, USAHarvard University Library, USAGWDG, Germany
13
International DOI Foundation
DataCite
Mitglieds-institution
Data CentreData CentreDatenzentrum
Mitglieds-institution
Data CentreData CentreDatenzentrum
…
Geschäftsstelle (TIB)
Registrierungsagentur
AssociateStakeholder
DataCite Struktur
Ziele von DataCite
• Leichteren Zugang zu Forschungsdaten ermöglichen • Akzeptanz von Forschungsdaten als relevanter, zitierfähiger
Bestandteil des wissenschaftlichen Leistungsausweises stärken • Datenarchivierung unterstützen, sodass Forschungsresultate
verifiziert und nachgenutzt werden können • Entwicklung von Standards, Workflows und Best Practices
14
DataCite Working Groups
• Metadata Working Group− Weiterentwicklung des DataCite Metadatenschemas unter
Berücksichtigung von bestehenden Standards und Anforderungen der Wissenschaft
• Policy and Best Practices Working Group (PBPWG)− Leitlinien für DataCite-Mitglieder− Empfehlungen für DOI-Vergabe und Zitierung von Forschungsdaten:
Dynamische Daten, Versionierung, Granularität − Verfolgen aktueller Entwicklungen und Initiativen− Anstoßen und Begleiten von Entwicklungen bei Datacite
15
16
Datenzentrum
Wissenschaftler
Metadaten & URL
Daten
DOI
Kataloge/Suchportale
Workflow
17
• 6.8 Mio DOI-Registrierungen bis 12/2015 für die folgenden Typen:
Inhaltstypen
Metadaten I
• Vorgabe der IDF, ein Mindestmaß an identifizierenden Metadaten vorzuhalten
• DataCite Metadata Schema− Metadatenschema für die Verlinkung von Daten und anderen
Objekten− Disziplinübergreifend− Auf Dublin Core basierend
Metadaten II
• Struktur des Metadatenschemas− Pflichtelemente, empfohlene und optionale Elemente− Pflicht: Identifier, Creator, Title, Publisher, PublicationYear− Mit nächster Version des Metadatenschemas ResourceType
(z.B. Dataset, Image, Text) ebenfalls Pflicht
• Metadata Working Group: Weiterentwicklung des Metadatenschemas− Aktualisierungen der kontrollierten Vokabulare− Verbesserungen in der Dokumentation− Austausch mit der Community
19
DataCite - Staff
Executive Director - Trisha CruiseTechnical Director - Martin Fenner (THOR)Senior Developer - Sebastian PetersCommunication Director - Laura Rueda (THOR)Business Manager: - Britta Dreyer
20
THORTECHNICAL AND HUMAN INFRASTRUCTURE FOR OPEN RESEARCH
● 30 month project (start: June 2015)
● funded by European Commission: Horizon 2020
● budget of 3.5 Mio
● domains: high energy physics, life sciences, earth sciences,
and humanities
● Natural next step from ODIN; in part implementing the ODIN
Roadmap
21
THORParticipants
● Led by The British Library
● 10 project partners from 7 countries
Elsevier Labs
EMBL-EBI
23
THORInhalte
What will THOR do?
Human =
Technical =
seminars
information
documentation
DataCite Search
24
• Entwicklung aus dem THOR Projekt
• Nächster Schritt: ORCID-Auto update
DataCite SearchCC License
25
DataCite SearchCitation Service
26
DataCite Lab SearchAdd to ORCID
27
DataCite SearchProfile
28
Metrics for Research Data
• Zitierungen (Data Citation Index)• Daten werden nicht zitiert• Keine Standards (Metadaten?, Referenzlisten?)
• Bereinigte Zugriffstatistiken http://www.projectcounter.org/
29
Making Data Count (MDC)
30 https://dlm.datacite.org/
• NSF founded project to design and develop metrics that track and measure data use data-level metrics (DLM)
• Citation tracking through full article search – open access journalsPLOS and Europe PMS
• DataCite is hosting the DLM service from PLOS
Data-Level Metrics (DLM)
31
Eintrag im DataCite Search
Ein API für Metrics
DataCite Link Store
• Basis ist Lagotto – open source application von PLOS
• Collect events around scholarly content (DOI Event Tracker)
• Article-Level Metrics, Data-Level Metrics und Software-Level-Metrics
ORCID CrossRef
DataCite Github
• Verschiedene Filter z.B. Anzeige aller Publikationen zu einer ORCID
• Zusammenarbeit mit CrossRef
• Ist die Zukunft für Metrics
32
DataCite Link StoreSources
33
DataCite Link StoreStatus
34
DataCite Link StoreSoftware Citation
• “If this is the first release of your code then you should give it a version number of 1.0. Fill in any release notes and click the Publish release button.”
• The Github/Zenodo integration assigns a DOI to a particular Github release of a software repo
35https://guides.github.com/activities/citable-code/https://blog.datacite.org/software-citation-workflows/
Code repositories are the places where the actual work on software takes place
36
DataCite Link StoreSoftware Citation
Status Page
37
DataCite ServicesLinks
38
Blog https://blog.datacite.org
Citation Formatter http://crosscite.org/citeproc
Content Resolver http://data.datacite.org/
Data-Level Metrics https://dlm.datacite.org
Homepage https://www.datacite.org
Link Store https://ls.datacite.org
MDS https://mds.datacite.org
OAI-PMH Service http://oai.datacite.org
Profiles https://profiles.datacite.org
Schema http://schema.datacite.org
Search https://search.datacite.org/
Statistics http://stats.datacite.org
ToDoList
39
ORCID
DataCite DOI
ORCID in DataCite Metadata
Feedback DataCite Labs projects
Kooperationen I
• Thomson Reuters – Data Citation Index− Harvesten von Metadaten über DataCite− Vorteile für Kunden: Sichtbarkeit im Web
of Science
• re3data.org− Verzeichnis von Datenrepositorien − Zusammenführung von re3data.org und
Databib unter dem Dach von Datacite
40
41
• Research Data Alliance (RDA): DataCite affiliated member
• Endorsement of the Force11„Joint Declaration of Data Citation Principles“
Kooperationen II
42
Kooperationen III
In Zusammenarbeit mit CrossRef• http://crosscite.org/citeproc/
Der Citation Formater stellt Zitierungen in über 100 Formaten bereit.• http://crosscite.org/cn/
Über die Content Negotiation kann maschinell direkt auf verschiedene (vorher hinterlegte) Medienformate eines Objektes zugegriffen werden.
Mit STM Verlagen• Verbesserung des Zugriffs auf und der Findbarkeit von Forschungsdaten• Förderung von bidirektionalen Verlinkungen zwischen Datensätzen und
Publikationen in Datenarchiven• Erhöhung der Sichtbarkeit von Links zwischen Publikationen und
Datensätzen