Top Banner
WIDaT 2019 WORKFLOW DE AGREGAÇÃO DE DADOS: Processos para Criação de uma Interface de Busca Integrada do Patrimônio Cultural Joyce Siqueira Dalton Lopes Martins
19

Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

Aug 25, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

WIDaT

2019

WORKFLOW DE AGREGAÇÃO DE DADOS: Processos para Criação de uma Interface de

Busca Integrada do Patrimônio Cultural

Joyce Siqueira

Dalton Lopes Martins

Page 2: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

AGREGAÇÃO DE DADOS

WORKFLOW DE AGREGAÇÃO DE DADOS: Processos para Criação de uma Interface de Busca Integrada do Patrimônio Cultural

2

Page 3: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

OBJETIVOS

WORKFLOW DE AGREGAÇÃO DE DADOS: Processos para Criação de uma Interface de Busca Integrada do Patrimônio Cultural

3

Localizar e analisar workflows de

agregação de dados, desenvolvidos por

instituições culturais, a fim de identificar

as principais etapas propostas.

Page 4: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

METODOLOGIA

WORKFLOW DE AGREGAÇÃO DE DADOS: Processos para Criação de uma Interface de Busca Integrada do Patrimônio Cultural

4

Pesquisa descritiva e bibliográfica, de natureza qualitativa,

realizada em bases de dados acadêmicas e na literatura

cinzenta.

As buscas foram realizadas no Google, Google

Acadêmico, EBSCOhost e BRAPCI, utilizando os termos:

“pipeline”, “workflow”, “architecture”, “aggregation”,

“metadata ingest”, “metadata aggregation”, “europeana”,

“mexicana”, “dpla”, “digital public library of america”,

“trove”, “digitalnz”, “aggregative data infrastructures”.

Page 5: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

5

Foram encontrados sete workflows:

1. American Art Collaborative

2. Secretaria de Cultura do México - Repositório Mexicana

3. Universidade de Nevada - UNLV's Linked Data Project

4. Europeana

5. Biblioteca Nacional da Austrália - Trove

6. Istituto di Scienza e Tecnologie dell’Informazione –

DNET

7. Biblioteca Nacional da Nova Zelândia - DigitalNZ

Page 6: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

6

A American Art Collaborative é um consórcio de 14 instituições de

arte, nos Estados Unidos, que visam investigar e começar a construir

uma massa crítica de Linked Open Data – LOD.

Page 7: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

7

A Secretaria de Cultura do México desenvolveu a Mexicana, um

Repositório do Patrimônio Cultural do México, livre e aberto, que tem o

objetivo principal de difundir e vincular os acervos do patrimônio

cultural do México.

Page 8: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

8

A Universidade de Nevada, por meio da equipe do departamento

de Coleções Digitais das Bibliotecas da Universidade, desenvolveu o

UNLV's Linked Data Project .

Page 9: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

9

Page 10: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

10

A Fundação Europeana, desenvolveu a Europeana, que reuniu mais

de 55 milhões de objetos digitais das coleções on-line de mais de

3.500 galerias, bibliotecas, museus, coleções audiovisuais e arquivos

de toda a Europa.

Page 11: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

11

O Istituto di Scienza e Tecnologie dell’Informazione desenvolveu

o D-NET, um software que oferece um kit de serviços para a

construção de Infraestruturas de dados.

Page 12: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

12

A Biblioteca Nacional da Nova Zelândia junto a Rede do povo

Aotearoa Kaharoa desenvolveu, no início de 2006, o DigitalNZ, que

utiliza o software Supplejack para agregação de dados.

Page 13: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

RESULTADOS

13

A Biblioteca Nacional da Austrália desenvolveu o Trove, que tem o

objetivo de fornecer recursos relacionados à Austrália. Além de um

mecanismo de busca, reúne conteúdo de bibliotecas, museus, arquivos

e outras organizações de pesquisa e fornece um conjunto de serviços.

Page 14: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

14

Page 15: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

ETAPAS PARA AGREGAÇÃO

15

Projeto/

Etapas Extr

air

Uti

lizar

on

tolo

gias

Tran

sfo

rmar

Re

con

cilia

r

Arm

aze

nar

Pu

blic

ar

Exp

or

Po

ssib

ilita

r n

ova

s ap

licaç

õe

s

AAC X X X X X X X X

Digital NZ X - - X X X - -

D-Net X - X X - X X -

Europeana X X X X X - - -

Mexicana X - X X X X X X

TROVE X - - - X X - -

UNLV's X X X X X X X -

Page 16: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

ETAPAS PARA AGREGAÇÃO

16

1.Extrair: extração dos dados em sua forma bruta, que

podem estar, por exemplo, em pdf, em planilhas

eletrônicas, documentos de texto, XML, em bancos de

dados relacionais, dentre outras opções.

2.Utilizar ontologias: selecionar vocabulários controlados

pré-existentes para aplicação nos dados.

3.Transformar: realizar a normalização, limpeza e

correção sintática dos dados.

4.Reconciliar: enriquecer os metadados por meio de

outros dados existentes na web.

Page 17: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

ETAPAS PARA AGREGAÇÃO

17

5. Armazenar: local onde os dados coletados serão

armazenados.

6.Publicar: desenvolver uma interface única para busca

integrada.

7.Expor: disponibilizar os dados agregados por meio de

API, que exponham os dados em formato RDF, OAI-

PMH ou JSON.

8.Possibilitar novas aplicações: a partir dos arquivos

disponibilizados na etapa ‘Expor’ novas aplicações

podem ser criadas.

Page 18: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

CONCLUSÃO

18

• Workflows são genéricos e não apresentam o fluxo real de

processos necessários, contrariando assim, um dos

princípios básicos de um workflow, que é a possibilidade de

ser replicado.

• Percebe-se a necessidade de um conhecimento técnico

avançado e especializado para compreensão de todas as

etapas.

• Percebe-se pouca preocupação com a qualidade dos

dados inseridos, ou seja, os dados coletados na etapa de

extração.

• Constata-se que não há escalabilidade, ou seja, à medida

que o fluxo de dados cresce, o workflow torna-se

impraticável.

Page 19: Apresentação do PowerPointwidat2019.fci.unb.br/images/apresentacoes/app_trabalhos/sessao_2… · Title: Apresentação do PowerPoint Author: genilson geraldo Created Date: 11/28/2019

OBRIGADA

Joyce Siqueira | [email protected]

Dalton Lopes Martins | [email protected]

WIDaT

2019

WORKFLOW DE AGREGAÇÃO DE DADOS: Processos para Criação de uma Interface de

Busca Integrada do Patrimônio Cultural