Top Banner
1 Hideya KAWAJI RIKEN Preventive Medicine & Diagnosis Innovation Program (PMI) RIKEN Advanced Center for Computing and Communication (ACCC) [email protected] Editorial Board Member, Scientific Data [email protected] 日本人類遺伝学会・遺伝子治療合同大会ランチョンセミナー データの再利用を促進する オープンアクセス・オープンデータジャーナル Scientific Data: An open access and open data publication to facilitate reproducible research
10

141122 sci data-japan_nov2014

Jul 08, 2015

Download

Science

Hideya Kawaji

a brief introduction to Scientific Data (http://www.nature.com/sdata/), with some translation in Japanese.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 141122 sci data-japan_nov2014

1

Hideya KAWAJI

RIKEN Preventive Medicine & Diagnosis Innovation Program (PMI) RIKEN Advanced Center for Computing and Communication (ACCC)

[email protected]

Editorial Board Member, Scientific Data [email protected]

日本人類遺伝学会・遺伝子治療合同大会ランチョンセミナー

データの再利用を促進する オープンアクセス・オープンデータジャーナル

Scientific Data: An open access and open data publication to facilitate reproducible research

Page 2: 141122 sci data-japan_nov2014

Our research...

2

Raw data

interpretation

Hypothesis,idea

Page 3: 141122 sci data-japan_nov2014

… can be more productive by sharing

3

Raw data

interpretation

Hypothesis,idea

Page 4: 141122 sci data-japan_nov2014

Get Credit for Sharing Your Data Publications will be indexed and citeable. 引用可能な形で、査読を経た論文としてデータを公開できるため、研究データの登録や共有に対するクレジットが得られる

Open-access Creative Commons licenses (CC-BY/CC-BY-NC) for the main Data Descriptor. Each publication supported by CCO metadata. 全てのユーザーが出版されたデータ記述とデータセットを利用可能

Focused on Data Reuse All the information others need to reuse the data; no interpretative analysis, or hypothesis testing 他者がデータを再利用するのに必要な情報のみ出版;分析や仮説検証などを含まない

Peer-reviewed Rigorous peer-review focused on technical data quality and reuse value データが該当する研究コミュニティーで標準的な形式・内容かどうかに焦点を当て、データの品質と再利用性について厳格な査読を行う

Promoting Community Data Repositories Not a new data repository; data stored in community data repositories 本誌は新しいデータリポジトリではなく、データセット自体は各研究コミュニティーに認知されたリポジトリを利用 する

ので、リポジトリ活用も促進する

Page 5: 141122 sci data-japan_nov2014

Sections: •  Title •  Abstract •  Background & Summary •  Methods •  Technical Validation •  Data Records •  Usage Notes •  Figures & Tables •  References •  Data Citations

The ‘Data Descriptor’ article Detailed descriptions of the methods and technical analyses supporting the quality of the measurements. Does not contain tests of new scientific hypotheses 実験やデータ収集の質を保障する技術的分析や方法の詳細な記述。新たな科学的仮説の検証は含まない。

Get credit.

Page 6: 141122 sci data-japan_nov2014

Scientific Data – launched May 2014

Article type: Peer-reviewed “Data Descriptor”.

Editorial team Managing Editor (Andrew Hufton) Editorial Curator (Varsha Khodiyar) Honorary Academic Editor (Susanna Sansone, Oxford) Advisory Panel and Editorial Board

Open access article processing charge $1,000 USD / £650 GBP / €750 for each accepted article

6

Open access.

Page 7: 141122 sci data-japan_nov2014

Experimental metadata

or structured component

(in-house curated, machine-readable

metadata with each article)

Article or narrative

component (PDF and HTML)

Example: Datasets not described in existing publications

Data reuse

Page 8: 141122 sci data-japan_nov2014

Peer review at Scientific Data Focuses on: •  Completeness (can others reproduce?)

完全性(データを他者が再現し再利用できるか?) •  Consistency (were community standards followed?)

一貫性(コミュニティーの報告基準に従っているか?) •  Integrity (are data in the best repository?)

整合性(データは適切なリポジトリに登録されているか?) •  Experimental rigour and technical quality

(were the methods sound?) 実験の厳密さと技術的品質(実験方法は有効か?)

Does not focus on:

•  Perceived impact/importance 予測されるインパクトや重要性

•  Size/complexity of data データの規模や複雑さ

Peer-reviewed

with community.

Page 9: 141122 sci data-japan_nov2014

Example: Expand on previous publication

•  Genome resequencing data released

to GenBank & ENA •  Mapped QTLs released as

Supplementary Material

•  Phenotypic data (195 assays) with richer methods descriptions

•  Genotyping array data via ArrayExpress

•  Haplotype dosages (>10GB) •  Remapping of all data to the newest

Rat genome version

Page 10: 141122 sci data-japan_nov2014

The role of data journals/papers

•  Credit/incentive for researchers to publish data クレジットを得ることが、研究者がデータを公開するインセンティブに

•  Mechanism to publish data not associated with a traditional

publication 従来の出版物には無かった、データ公開のための機能を提供する

•  Full peer review and curation of data enables reuse and helps

compliance with community/funder expectations データの査読とキュレーションによってデータを再利用可能なものとすると同時に、コミュニティと助成金提供者の期待と一致させる

•  Make datasets more visible an discoverable データセットの可視性と発見可能性を高める

•  Narrative helps understanding of methodological details 説明的記述がデータ収集や実験方法など詳細の理解を助ける

•  Important part of NPG’s initiative to increase reproducibility

(via Data Descriptors in Scientific Data)  Scientific DataのData Descriptorの場合、研究の再現・再利用を促すというNPGのイニシアティブにおいて中心的役割を担う

10