Top Banner
Repositori Akses Terbuka di Indonesia Ismail Fahmi, PhD. Inisiator Indonesia OneSearch (IOS) [email protected] Lokakarya Nasional PDII LIPI 10 Agustus 2016
51

Repositori Akses Terbuka di Indonesia (PDF)

Jan 09, 2017

Download

Technology

Ismail Fahmi
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Repositori Akses Terbuka di Indonesia (PDF)

Repositori Akses Terbuka di IndonesiaIsmail Fahmi, PhD.InisiatorIndonesia OneSearch (IOS)[email protected]

Lokakarya Nasional PDII LIPI10 Agustus 2016

Page 2: Repositori Akses Terbuka di Indonesia (PDF)

2

1992 – 2007 S1, Teknik Elektro, ITB2003 – 2004 S2, Computational Linguistics, Universitas Groningen, Belanda2004 – 2009 S3, Computational Linguistics, Universitas Groningen, Belanda

2000 – 2003 Inisiator IndonesiaDLN (Digital Library Network pertama di Indonesia)Mengembangkan Ganesha Digital Library (GDL)Mendirikan Knowledge Management Research Group (KMRG) ITBMembangun Digital Library ITB

2009 – Sekarang Engineer di Weborama, Perusahaan berbasis big data (Paris/Amsterdam)2012 – Sekarang Co-Founder Awesometrics, Media Monitoring & Analytics Company2014 – Sekarang Founder PT. Media Kernels Indonesia, a Natural Language Processing Company2015 – Sekarang Konsultan Perpustakaan Nasional, Inisiator Indonesia OneSearch

Ismail Fahmi, [email protected]

Page 3: Repositori Akses Terbuka di Indonesia (PDF)

Agenda

•Manfaat Open Access•Pengumpulan Data•Metadata•Otomasi Pengolahan•Temu Kembali•Semantic Web•Copyright

3

Page 4: Repositori Akses Terbuka di Indonesia (PDF)

4

Jack Andraka15 tahun, USA

Page 5: Repositori Akses Terbuka di Indonesia (PDF)

5

Page 6: Repositori Akses Terbuka di Indonesia (PDF)

Open Access Around The World

6

Page 7: Repositori Akses Terbuka di Indonesia (PDF)

Goal

7

“To have a robust national open access repository

discovery system”

INDONESIADiscovery System

Page 8: Repositori Akses Terbuka di Indonesia (PDF)

OAI Discovery System

8

Merupakan sebuah

Page 9: Repositori Akses Terbuka di Indonesia (PDF)

Indonesia OneSearch (IOS)

9

Page 10: Repositori Akses Terbuka di Indonesia (PDF)

Sumber Data: Perpustakaan

10

Total:66.000+

* Sumber: Perpusnas 2016

Page 11: Repositori Akses Terbuka di Indonesia (PDF)

Jenis Data

11

Katalog Buku E-Journal Digital Repository Museum

Discontinued

Page 12: Repositori Akses Terbuka di Indonesia (PDF)

Pengumpulan Data

12

OAI-PMHa low-barrier interoperability framework

Standard Interoperability Protocol

~75% Repository di seluruh dunia ‘OAI-Compliant’

Page 13: Repositori Akses Terbuka di Indonesia (PDF)

Skenario Harvesting

13

Page 14: Repositori Akses Terbuka di Indonesia (PDF)

Any Platforms – Any Collections

14

Any Platforms Any Collections

Page 15: Repositori Akses Terbuka di Indonesia (PDF)

Standard OAI-PMH

15

Harvester Provider(Repository)

Request Verbs:• Identify• ListMetadataformats• ListSets• ListIdentifiers• ListRecords• GetRecord

https://www.openarchives.org/OAI/openarchivesprotocol.html

Page 16: Repositori Akses Terbuka di Indonesia (PDF)

Semua Harus Mengikuti Standard

16

http://an.oa.org/OAI-script? verb=ListRecords&

from=1998-01-15&set=physics:hep&metadataPrefix=oai_rfc1807

https://jurnal.uns.ac.id/index.php?journal=alchemy&page=oai&verb=ListRecords&

metadataPrefix=oai_dc badArguments:journal,page

https://www.openarchives.org/OAI/openarchivesprotocol.html

Page 17: Repositori Akses Terbuka di Indonesia (PDF)

Metadata

17

Paling banyak dimplementasikan(berdasarkan data Indonesia OneSearch):• MARC à marcxml• DC à oai_dc

http://an.oa.org/OAI-script? verb=ListRecords&metadataPrefix=oai_dc

http://an.oa.org/OAI-script? verb=ListRecords&metadataPrefix=marcxml

Page 18: Repositori Akses Terbuka di Indonesia (PDF)

Metadata Harus Standard

18

Semua platform software yang berbasis open sourceseperti OJS, Eprints, Dspace, dan Koha, sudah medukung dan comply dengan standard OAI-PMH dan metadata.

Software lokal cukup banyak yang tidak mendukung OAI-PMH, atau yang tidak comply.

SLIMS paling banyak digunakan di Indonesia, dan versi lama belum comply. Versi OAI-PMH untuk SLIMs dapat didownload di: http://wiki.onesearch.id/doku.php?id=oai-slims

Page 19: Repositori Akses Terbuka di Indonesia (PDF)

Otomasi Pengolahan

19

Valid?

Repository Admin Harvester AdminOAI Harvester & Index

PeriodicHarvesting

No Yes

Page 20: Repositori Akses Terbuka di Indonesia (PDF)

Temu Kembali

20

• Auto-Suggest• Relevancy Search• Faceting• Deduplication

Page 21: Repositori Akses Terbuka di Indonesia (PDF)

Auto-Suggest

21

Page 22: Repositori Akses Terbuka di Indonesia (PDF)

Relevancy & Facet

22

Sort by Relevancy, etc.

Facet

Page 23: Repositori Akses Terbuka di Indonesia (PDF)

Duplicate Records

23

Page 24: Repositori Akses Terbuka di Indonesia (PDF)

Deduplication

24

Sebelum Sesudah

Page 25: Repositori Akses Terbuka di Indonesia (PDF)

Semantic Web

25

Page 26: Repositori Akses Terbuka di Indonesia (PDF)

Contoh: Semantic Search

26

Fact Extraction

Page 27: Repositori Akses Terbuka di Indonesia (PDF)

Fact Extraction

27

Fact extractedfrom document

Page 28: Repositori Akses Terbuka di Indonesia (PDF)

Fact Extraction dalam Medical

28

Fact extractedfrom document

Page 29: Repositori Akses Terbuka di Indonesia (PDF)

29

Page 30: Repositori Akses Terbuka di Indonesia (PDF)

Knowledge Graph

30

Page 31: Repositori Akses Terbuka di Indonesia (PDF)

Resource Description Framework (RDF)

31

Page 32: Repositori Akses Terbuka di Indonesia (PDF)

IOS: Fact Extraction

32

Page 33: Repositori Akses Terbuka di Indonesia (PDF)

Text Analysis

33

Text Analysis is:• the process of

analyzing unstructured text,

• extracting relevant information

• and then transformingthat information into structured information

• that can be leveragedin different ways

Page 34: Repositori Akses Terbuka di Indonesia (PDF)

Contoh: Tesis “Hak Ulayat”

34

Page 35: Repositori Akses Terbuka di Indonesia (PDF)

Contoh: Tesis dari UNDIP

35

Fullteks tesis: 112 halamanBahasa: Indonesia

Page 36: Repositori Akses Terbuka di Indonesia (PDF)

36

S

P

O

Page 37: Repositori Akses Terbuka di Indonesia (PDF)

Fact Graph

37

Page 38: Repositori Akses Terbuka di Indonesia (PDF)

Fact Graph

38

Page 39: Repositori Akses Terbuka di Indonesia (PDF)

Co-occurrence Analysis

39

Page 40: Repositori Akses Terbuka di Indonesia (PDF)

Open vs Closed Access

40

Page 41: Repositori Akses Terbuka di Indonesia (PDF)

Open vs Closed Access

41

Page 42: Repositori Akses Terbuka di Indonesia (PDF)

Contoh: Tesis dari UAJ

42

Page 43: Repositori Akses Terbuka di Indonesia (PDF)

Open Access: Enabling Innovation

43

Tesis dari UNDIP Tesis dari UAJ

Page 44: Repositori Akses Terbuka di Indonesia (PDF)

Text Analysis: Manfaat

44

Semoga bisa menjadi dasarpemahaman:• interdisiplinaritas, • cross-disciplinarity, • transdisciplinarity, dan

multidisciplinarity

- Edda Priyanto – Dosen Ilmu Perpustakaan UGM

Page 45: Repositori Akses Terbuka di Indonesia (PDF)

Open Access Copyright

45

1. Authors sign a publishing agreement where they will have copyright but grant broad publishing and distribution rights to the publisher.

2. The author chooses an end user license under which readers can use and share the article.

3. The publisher makes the article available online with the author's choice of end user license.

Page 46: Repositori Akses Terbuka di Indonesia (PDF)

Text Analysis: Open Access Licensing

46

PDF, 55 pages, English

Page 47: Repositori Akses Terbuka di Indonesia (PDF)

Knowledge Graph: Open Access

47

Page 48: Repositori Akses Terbuka di Indonesia (PDF)

People

48

Page 49: Repositori Akses Terbuka di Indonesia (PDF)

Road Map IOS

49

Tahap 1 (2015): OneSearch Portal

OneSearch Portal (Bibliografi)

• Software Indonesia OneSearch

• Harvesting data bibliografi• Protokol standard OAI-PMH• Repository: Katalog buku,

Jurnal Online, Repositoridigital

Tahap 2 (2016-2017): Text Analysis

Text Analysis (Full Teks)

• Crawling fullteks (PDF) TA, tesis, disertasi, laporan penelitin, danartikel jurnal dari Intitusi di Indonesia.

• Text analysis menggunakanteknologi NLP (Natural Language Processing)

• Information Extraction & Knowledge Mapping berbasisNLP

• Research Mapping antar Institusi

Tahap 3 (2018-2020): Layanan Anti PlagiarismNo Plagiarism (Services)

• Sistem dan LayananNoPlagiarism untuk karyaberbahasa Indonesia.

• Sumber: Wikipedia (Bahasa Indonesia), Online News, TA, Tesis, Disertasi, artikel jurnal, laporan penelitian (open access)

• Layanan online plagiarism checking untuk mahasiswa danpeneliti di Indonesia

Page 50: Repositori Akses Terbuka di Indonesia (PDF)

Kesimpulan

50

• Open Access akan membantu mempercepat terjadinya INOVASI.

• Open Access Indonesia – Discovery System (OAI-DS), dibutuhkan untuk mengelola seluruh repositori Open Access dan seluruh jenis data (tidak terbatas pada e-jurnal).

• Indonesia OneSearch (IOS) adalah sebuah OAI-DS.• Text Analysis dan Fact Extraction dalam IOS merupakan

langkah awal membangun Knowledge Graph dari seluruh repositori Open Access di Indonesia.

Page 51: Repositori Akses Terbuka di Indonesia (PDF)

Terimakasih

51

Ismail Fahmi, PhDEmail: [email protected]: 0812 8908 3894