-
UPBox Soluo de armazenamento na nuvem para dados
cientficos na U.Porto
Orientando: Jos Barbosa
Orientadora: Prof. Cristina Ribeiro
Co-Orientador: Prof. Joo Correia Lopes
Mestrado Integrado em Eng.
Informtica e Computao
Apresentao Final (PDIS) 10-07-2012
-
Contexto
Aumento da gerao de dados de investigao
A partilha de dados e de recursos sero a chave para a resoluo
dos novos problemas da cincia e da
engenharia [1]
1
-
Contexto
Projeto de curadoria de dados na Universidade
do Porto [2]:
o UPData
2
-
Problemas
Os dados de investigao so armazenados
por contacto direto entre o curador e o
investigador:
Processo ineficaz; Desmotivao de investigadores; Necessidade de
mais recursos para
curadoria.
3
-
Objetivo
Incluir investigadores no processo de curadoria
Como?
Atravs de um sistema colaborativo baseado em servios
na nuvem:
Agilizar o processo de submisso de dados nos repositrios;
Estimular participao de investigadores no processo de curadoria;
Auxiliar investigadores na gesto e centralizao de dados de
investigao;
Integrao com sistema de anotao. 4
-
Objetivo
5
-
Motivao
Comunidade
A partilha de dados pode gerar nova
investigao
Dar visibilidade instituio
Investigador
Facilitar a organizao,
armazenamento e partilha de dados de investigao
Preservar os dados cientficos
6
-
Estado da Arte
Repositrios de dados de investigao:
1. Curadoria por organizaes cientficas:
o NCBI (National Center for Biotechnology Information).
o ICPSR (Inter University Consortium for Political and
Social Research);
o DANS (Data Archiving and Networked Services);
o UK Data Archive (Cincias Sociais e Humanidades).
7
-
Estado da Arte
Repositrios de dados de investigao:
2. Curadoria por Universidades:
o Datashare (Universidade de Edimburgo).
3. Curadoria por organismos oficiais:
o ANDS (Australian National Data Service).
8
-
Estado da Arte
Servios de armazenamento na nuvem
ownCloud, Dropbox, Ubuntu One o Centralizao de ficheiros;
o Gesto de ficheiros remota.
FTPbox o Centralizao de ficheiros com diretrio local.
9
-
Ideia
UPBox!
sistema simples e familiar
centralizar dados de investigao
anotar dados de investigao
permitir a participao do investigador no processo de curadoria
[2]
agilizar a preservao nos repositrios de dados
10
-
Requisitos da soluo
11
-
Proposta de soluo
12
-
Porqu WebDav?
Ao contrrio de FTP oferece [3]:
Gesto de ficheiros remota; Atribuir metadados a documentos;
Gerir permisses de acesso; Permite transferncia de ficheiros
segura.
13
-
Metodologia
Desenvolvimento iterativo: Mtodo gil;
Testes contnuos;
Feedback de investigadores;
Design simples.
Prova do conceito: Implementao do servidor com interface
web;
Implementao de aplicao simples para teste da API;
Testes com investigadores.
14
-
Planeamento
15
-
Referncias [1] Hey, T. (2003). The Data Deluge: An eScience
Perspective. Grid computing, (January 2003), 1-17. Retrieved
from
http://onlinelibrary.wiley.com/doi/10.1002/cbdv.200490137/abstract
[2] Ribeiro, C., Eugnia, M., Fernandes, M., & Porto, U.
(2011). Data Curation at U .
Porto: Identifying current practices across disciplinary domains
by, 14-17.
[3] Dridi, F., & Neumann, G. (n.d.). How to implement
Web-based groupware systems
based on WebDAV. Proceedings. IEEE 8th International Workshops
on Enabling
Technologies: Infrastructure for Collaborative Enterprises (WET
ICE99), 114-119. IEEE Comput. Soc.
doi:10.1109/ENABL.1999.805185
[4] Ribeiro, C., Saraiva, R., Rodrigues, E., Fernandes, M.,
Marques Gomes, C., &
Carvalho, J. (2010). Os Repositrios de Dados Cientficos: Estado
da Arte.
16