Top Banner
Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma
70

Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Jun 08, 2015

Download

Documents

Ine Willems
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Data wat is het en hoe kun je het vinden?

Marina Noordegraaf & Wouter Gerritsma

Page 2: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

onderzoeksdata• Line-up

• Data, wat is het?definitie, research life cycle, data life cycle, data formats, open data, jullie data

• Waarom is het ineens zo’n HOT issue?

• How to search 4 data repositories (waar vind ik ze?)• Oefening: zoek een data repository op jouw vakgebied en vind een dataset

• Metadata en data citatie (linking research together)

• How to search IN data repositories/data portals (hoe vind ik data)? • Oefening: zoek datasets in Narcis (data portal), DANS EASY, 3TU.Datacentrum, DANS Data

Portal

• Wrap-up (waarom vond ik wat ik vond?)

• Staying up to data

Page 3: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

“Research data is defined as the recorded factual

material, commonly accepted in the scientific community as necessary

to validate research findings

“http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1186&context=lib_research

Page 4: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Alles wat van belang is voor het begrip/traceren van de publicatie.

Niet alleen onderzoeksdata zelf, maar ook manier waarop data verzameld: Context, Metadata,

Supplementary Material

Page 5: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 6: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA bij NATUURWETENSCHAPPEN

– Observaties, nummers, meetpunten, coördinaten, frequenties, opgeslagen in b.v. spreadsheets en databases

– Discipline-specifiek, b.v. • Life-Sciences: genexpressies, DNA-to-RNA

translations, protein sequences, eiwitstucturen, NMR data van biomoleculen• Sterrenkunde: foto’s, mapping the universe• …….

Page 7: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA bij SOCIALE WETENSCHAPPEN

• Survey-onderzoek– Interviews– Vragenlijstonderzoek

• Data uit experimenten (je brengt mensen in voorbeeldsituaties en noteert wat ze doen)

• Filmpjes/stimulusmateriaal bij deze experimenten• Programmatuur, simulaties (gefingeerde data)• Transcripts van rechtszaken, … • ..

Page 8: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA FORMATS

Page 9: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA FORMATS

Een data formaat of bestandsformaat is de

vorm waarin informatie gecodeerd is.

De informatie is op zo'n manier gecodeerd dat een programma of toepassing (application) de data kan

herkennen, lezen en gebruiken

http://dataintelligence.3tu.nl/ii-data-management/data-formaten/

“ “

Page 10: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

OPEN FORMATS

The safest option to guarantee long-term data access and usable

data is to convert data to standard formats that most software are

capable of interpreting, and that are suitable for data interchange and

transformation

http://www.data-archive.ac.uk/create-manage/format/formats

“ “

Page 11: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

OPEN FORMATS

This typically means using open or standard formats - such as OpenDocument Format (ODF),

ASCII, tab-delimited format, comma-separated values, XML - as opposed to proprietary ones. Some

proprietary formats, such as MS Rich Text Format, MS Excel, SPSS, are widely used and likely to be

accessible for a reasonable, but not unlimited, time

http://www.data-archive.ac.uk/create-manage/format/formats

“ “

Page 12: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 13: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

HOW (re)USABLE?

Page 14: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA bij JULLIE ?

• Welke data worden in jullie instelling geproduceerd ?

• Van welke ruwe data maken jullie(onderzoekers) gebruik

(of zouden ze gebruik vanWILLEN maken) ?

Page 15: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Waarom is het ineens zo’n HOT

issue?

Page 16: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

“ In almost every laboratory,

“born digital” data proliferate in files,

spreadsheets, or data-bases stored on hard

drives, digital notebooks, Web sites, blogs, and

wikis.

The management, curation, and archiving of

these digital data are becoming increasingly

burdensome for research scientists.

http://www.cloudinnovation.com.au/Bell_Hey%20_Szalay_Science_March_2009.pdf

Page 18: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

2011Research misconduct includes fabrication, falsification, suppression, or inappropriate manipulation of data; inappropriate image manipulation; plagiarism; misleading reporting; redundant publication; authorship malpractice such as guest or ghost authorship; failure to disclose funding sources or competing interests; misreporting of funder involvement; and unethical Research

http://publicationethics.org/files/A_consensus_statement_on_research_misconduct_in_the_UK.pdf

““

Page 19: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

2011

Page 22: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Journals Data Availability Policy

Page 23: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Journals Data Availability Policy

Page 24: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Journals Data Availability Policy

http://oad.simmons.edu/oadwiki/Journal_open-data_policies

Page 25: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

http://www.vitae.ac.uk/CMS/files/upload/Vitae_Information_Literacy_Lens_on_the_RDF_Apr_2012.pdf

Information Literacy has gone data

In the 21st century, information literacy is a key attribute for everyone, irrespective of age or experience. Information literacy is evidenced through understanding the ways in which information and data is

created and handled, developing skills in its management and use and modifying attitudes, habits and

behaviours to appreciate the role of information literacy in learning and

research

Page 26: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

HOW 2 SEARCH 4 DATA

Page 27: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

HOW 2 SEARCH 4 DATA

Page 28: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 29: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

HOW 2 SEARCH 4 DATA

data paper

data repository(institutional,domain specific (communitysupported))

research data

directory of data

repositories

data portal (regional, national, …)

Zoeken naar data repository

zoeken naar data in meerdere data repositories

Page 30: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

How to search 4 data repositories

data paper

data repository(institutional,domain specific (communitysupported))

research data

directory of data

repositories

data portal (regional, national, …)

Zoeken naar data repository

zoeken naar data in meerdere data repositories

Page 31: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Directory of Research Data Repositories

• http://databib.org/• http://datacite.org/repolist• http://

oad.simmons.edu/oadwiki/Data_repositories

• Discipline – Specifiek, b.v. http://biosharing.org/biodbcore

• Perspectief: http://datacatalogs.org/ (m.n. Overheidsinfo)

Page 32: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Directory of Research Data Repositories

Page 33: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Directory of Research Data Repositories

Page 34: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Research Data Repositories - discipline

http://biosharing.org/biodbcore

Page 35: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA bij JULLIE ?

• Welke data worden in jullie instelling geproduceerd ?

• Van welke ruwe data maken jullie(onderzoekers) gebruik

(of zouden ze gebruik vanWILLEN maken) ?

Page 36: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Oefening 1• Zoek (b.v. via http://databib.org) een data

repository op het vakgebied dat jij ondersteunt (of op één van de vakgebieden van jouw instelling)

• Kies er één uit en ga zoeken naar een dataset• Hoe heb je de dataset gevonden?

Page 38: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

“ Scientific metadata provide the

information necessary for investigators

separated by time, space, institution or disciplinary norm to establish common

ground

“DataCite. (2011). DataCite MetaData

Scheme for the Publication and Citation of Research Data. http://

schema.datacite.org

METADATA

Page 39: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

METADATA

Page 40: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 41: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

METADATA

The gray line separates

medata from data

Page 42: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA CITATION

“ “

Page 43: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA CITATION

“The practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to articles

http://ands.org.au/guides/data-citation-awareness.html

Page 44: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA CITATION

“Getting credit through formal citation, obtaining copies of articles that use the data, and learning of

products or publications that use the data are just some of the conditions

that will help encourage data sharing

http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101

Page 45: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

PERSISTENT Identifiers

Een Persistent Identifier identificeert het object

zélf onafhankelijk van de plaats waar deze staat

Page 47: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Handle

Page 48: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DOI

• DOI stands for "Digital Object Identifier (http://datacite.org/whatisdoi)

• Gebaseerd op Handle, maar een handle maakt het niet uit WAT er geidentificeerd wordt terwijl een DOI gebaseerd is op een datamodel die uitgaat van relaties tussen objecten

• Resolve a DOI http://dx.doi.org/

• Meer over persistent identifiers? – http://

wiki.esipfed.org/index.php/Interagency_Data_Stewardship/Identifiers/Table

– http://wiki.surf.nl/display/PersistentIdentifier/NL– http://www.doi.org/factsheets/DOIHandle.html

Page 49: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

DATA CITATION

Page 51: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

HOW 2 SEARCH 4 DATA

data paper

data repository(institutional,domain specific (communitysupported))

research data

directory of data

repositories

data portal (regional, national, …)

Zoeken naar data repository

zoeken naar data in meerdere data repositories

Page 52: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Research Data Repository

Page 53: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 54: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Research Data Portal

http://datacentrum.3tu.nl/nieuws-agenda/nieuwsbericht/datasets-3tudatacentrum-ook-in-narcis/

Page 55: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Research Data Portal

http://www.narcis.nl/searchhints/Language/nl

Page 56: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

HOW 2 SEARCH 4 DATA

data paper

data repository(institutional,domain specific (communitysupported))

research data

directory of data

repositories

data portal (regional, national, …)

Zoeken naar data repository

zoeken naar data in meerdere data repositories

Page 57: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Oefening 2• - Zoek in NARCIS http://www.narcis.nl de dataset met de titel: ‘Water

Expenditure and Service Levels in Mozambique’ (afkomstig uit DANS EASY). Dit

is jouw dataset 1

- Kijk of je deze dataset ook in DANS EASY https://easy.dans.knaw.nl/ kunt

vinden

- Wat is het verschil in getoonde velden tussen EASY en NARCIS?

- Kies een trefwoord dat wel wordt getoond in de EASY omschrijving van de

dataset en niet in de NARCIS omschrijving. Voer dit trefwoord vervolgens in in

NARCIS. Wat gebeurt er?

Page 58: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Zoekmogelijkheden

Page 59: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 60: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 61: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 62: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 63: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 64: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 65: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

ZOEKEN

Alleen door goed naar je

zoekresultaten te kijken en dit ook

vanuit verschillende oogpunten te doen,

kun je leren begrijpen hoe

gemaakte keuzes je zoekresultaten zullen

beïnvloeden.

Page 66: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Page 67: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Staying Up To Data

• https://www.surfspace.nl/sig/28-research-data/ • http://datapub.cdlib.org/• http://datapool.soton.ac.uk/• http://digital-scholarship.org/rdcb/rdcb.htm

Page 68: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Staying Up To Data

• Cursus volgen http://dataintelligence.3tu.nl• Naslag

http://libguides.library.uu.nl/onderzoeksdata

Page 69: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

Staying Up To (Medical) Data

• https://blog.surfnet.nl/?p=644

• Maak gebruik van je netwerk en/of begin met (sociaal) netwerken

Page 70: Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.

www.twitter.com/insearch4data

Marina Noordegraaf (www.verbeeldingskr8.nl)

Tot data• De plaatjes zonder bronvermelding zijn gemaakt door Marina Noordegraaf