Frank Oliver Glöckner and Michael Diepenbroek Kubus Leipzig, 06.06.2019 Community Workshop
Frank Oliver Glöckner and Michael Diepenbroek
Kubus Leipzig, 06.06.2019
Community Workshop
21998
3
Good Scientific Practice
Recommendation 7: Safeguarding and Storing of Primary Data
Primary data as the basis for publications shall be securely stored for ten years in a durable form in the institution of their origin.
The disappearance of primary data from a laboratory is an infraction of basic principles of careful scientific practice and justifies a prima facie assumption of dishonesty or gross negligence (9).
(9) Danish Committee on Scientific Dishonesty: Guidelines for Data Documentation, in: DCSD Annual Report 1994, København: The Danish Research Councils 1995
4
Value of Research Data
2007
2010
5
Value of Research Data2011
2014
6
Example DFG – DMP
FAIR Data
http://www.dfg.de/download/pdf/foerderung/antragstellung/forschungsdaten/guidelines_biodiversity_research.pdf
2015
7
Summary
THE GERMAN COUNCIL FOR SCIENTIFIC INFORMATION INFRASTRUCTURES
About the RfII
§ Founding resolution 2013, establishment 2014
§ Advisory board of the Joint Science Conference
§ Initially a four-year pilot phase, extended for another 4 years
§ 24 members, nominated using the same process as for the German Council of Science and Humanities
§ The composition of the Council “reflects our conception that the future of scientific information infrastructures is a joint task of the providing institutions, the scientific users, the funders, and related national and international stakeholders." (Joint Science Conference paper 13.48, 2013)
2
Diagnose
§ Dramatisches Anwachsen der Menge/Heterogenitätan Forschungsdaten in Deutschland- Forschungsdaten sind alle Daten, die im Zuge wissenschaftlicher Vorhaben entstehen, z.
B. durch Beobachtungen, Experimente, Simulationsrechnungen, Erhebungen, Befragungen, Quellenforschungen, Aufzeichnungen, Digitalisierung, Auswertungen.
§ Viele informative Stellungnahmen zu FDM,aber „Vollzugsdefizit“
§ Erheblicher Finanzierungs- und Personalbedarf
§ Zahlreiche Hürden bremsen den Wandel- Heterogene Förderlandschaft, fehlende Koordination, Technik- statt Prozessorientierung,
fachkulturelle Diversität und unklare Qualitätssicherungs- sowie Reputationsmechanismen, „Projektitis“ ohne Verstetigungschancen für erfolgreiche Projekte, Unsicherheiten der Akteure in Bezug auf strategische Investitionen
Vgl. RfII (2016)4
§ Nachhaltige Antwort auf den digitalen Wandel: Qualität und Dynamik von Datennutzung im Zusammenspiel mit digitalen Methoden im Gesamtsystemvoranbringen
§ Dienste-Portfolios organisiert entlang fachlich-thematischer Domänen, starke Rolle der wissenschaftlichen Datenerzeuger und -nutzer
§ Vernetzung horizontal zu den bestehenden Säulen im Wissenschaftssystem
§ Bundesweit gleichermaßen gute Versorgung mit Forschungsdaten-infrastrukturen (über Fach- und Institutionengrenzen hinweg)
§ International, und speziell europäisch, eingebunden („starker Knoten“ der EOSC)
Zum Konzept der NFDIKurzüberblick
5
Nationale Forschungsdateninfrastruktur (NFDI)Blick auf die Zeitschiene
Empfehlung RfII
Forschungsdaten-management als gemeinschaftliche Aufgabe der Wissenschaft und ihrer Träger
Grundsatzbeschluss GWK
Errichtung einer NFDI,Auftrag an Ad-hoc-AG
Zahlreiche positiveReaktionen aus demWissenschaftssystem
Vorbereitung der Umsetzung
Kommunikation/Planung in der Wissenschaft
Bund-Länder-Vereinbarung (Nov 2018)
2016 2017 2018 2019/20
Start der NFDI
Beginn des Auswahl-verfahrens (DFG)
Findung Direktorat und Einrichtung Geschäftsstelle
Kick-ff Konsortien (ca. Mitte 2020)
Parallelprozess EOSC
Coordination, working groups, standards, certification…
7
13
https://ww
w.dfg.de/foerderung/program
me/nfdi/index.htm
l
§ Gemeinsame Förderung durch Bund und Länder (Verhältnis 90:10)
§ Start 2019, mit der ersten von drei Ausschreibungsrunden und Findung Direktorat
§ Förderzeitraum zunächst 10 Jahre, in der Endausbaustufe bis zu 90 Mio. € pro Jahr
§ Ausgestaltung durch Nutzer und Erzeuger von Forschungsdaten, im Zusammenwirken mit Einrichtungen der wissenschaftlichen Infrastruktur („NFDI-Konsortien“)
§ Wissenschaftsgeleitetes Verfahren zur Begutachtung der Förderanträge von Konsortien, durchgeführt durch die Deutsche Forschungsgemeinschaft (DFG)
Ende 2018: Bund-Länder-Vereinbarung zur NFDIBeschluss der GWK - Eckpunkte
8
16
What is already available?
User oriented, national data infrastructure facilitating data sharing for biological and environmental research.
Established 2013
www.gfbio.org
17
Transition
DFG funded “Research” project with 20 partners
Single legal entity, sustainable
18
Whom do we serve? Biodiversity Community
• Diversity of
• Species
• Genomes
• Functions
• Interactions
• Ecosystems
Pictures provided by Wolfgang Reichert
19
Who are we? Institutions and Infrastructures
20
Who are we? Universities
Objectives & Work Program
Objectives
• Data management as an integral part of research• Lack of funding for data management• lack of awareness for existing data management services• data infrastructure services not optimally adapted to scientists needs• missing incentives for the management, archiving, and publication of data.• Insufficient data management skills -> data science
• FAIRness of data (re-usability)• data scattered across repositories, not findable and/or not accessible at all, • heterogeneity of measurements and observation types• substantial lack of standard compliance• Lack of interoperability
• Embedding NFDI4BioDiversity into the national & international landscape of data infrastructure services and science.• Fragmentation of existing data infrastructures, initiatives, & projects
Work program
• User engagement J• Data management services - FAIRness• Data integration, exploration, and exploitation• Cross-community engagement – ONE NFDI• Governance & sustainability of supplied infrastructures and services
User engagement
• Requirements analysis for the digital change - SWOT• Education – curricula, training• Reputation systems• Project data management (early mobilization of data)• Instant quality surveys, user feedback, quality management• Learned societies, authorities, organisations, associations
• GBIF, VBIO, GfÖ, GfBS, BfN, DZG, RDA, GoFAIR …
• Active participation in the development, maintenance & governance of NFDI4BioDiversity
User engagement
Expand our community• Crop science – system plant• Farm animals – functional biodiversity• Systems Biology – model management• Citizen Science – monitoring• de.NBI network – catch the users by data analysis
Data management services - FAIRness
• Data production & acquisition• Curation/Harmonisation• Archiving• Publication• Quality management and standards• Certification
Data integration, exploration, and exploitation
• virtual expandableinfrastructure• building on and
extending the federated infrastructure GFBio• allows users to store,
share, combine, & analyse diverse data• also cross-domain –
linking NFDI consortia
BiodiversityResearch Data Commons (BRDC)
BiodiversityResearch Data Commons (BRDC)
• Data structures• Content standards
• Semantics• Terminologies,
taxonomies• Concepts
BiodiversityResearch Data Commons (BRDC)
• Technical data types & packaging• Measurement &
observation types• Users & usages
(domains, tools …)• Producers
• Spot measurements to time series (days to decades)
• Local to global data• Observation data• Experimental data• Collected to sensor
data• Remote sensing
BiodiversityResearch Data Commons (BRDC)
Data availability & usability
Infrastructure development
Collaborative applications, Data science
• Development process
BiodiversityResearch Data Commons (BRDC)
Thank You
https://[email protected]