Apresentao do PowerPoint
Vocabulrios controlados na descrio de dados de investigao no
DendroYulia [email protected] de Engenharia da
Universidade do Porto/ INESC TEC
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Boa tarde a
todos, o meu nome Yulia e fao parte de grupo de investigadores
ligados a gesto de dados de investigao na Universidade do
Porto.
2
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Com aumento da
reutilizao dos dados de investigao a gesto de dados cada vez mais
valorizada. Metadados neste contexto tem um papel fundamental, pois
dados com descrio mais detalhada so mais fceis de interpretar e
reutilizar.
Mas o processo da descrio de dados exigente e demorado e pode
desmotivar os investigadores na descrio de dados.
3
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016A falta de
tempo, ferramentas adequadas, conhecimentos tambm complicam a
descrio de dados.
Por isso importante fornecer as ferramentas que simplificam o
processo de criao de metadados.
4
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Reconhecendo
essas dificuldades, estamos a desenvolver a plataforma Dendro, que
ajuda na organizao e documentao dos dados.
5
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016O Dendro
consiste numa interface web e facilita a descrio dos dados com a
utilizao de vrios esquemas de metadados existentes, por exemplo
Dublin Core,
E tambm descritores criados para domnios de investigao
especficos, como por exemplo Produo de Hidrognio.
6
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os objetivos do
meu trabalho sa:simplificar e normalizar a descrio de dados na
plataforma Dendro.De forma a motivar o interesse dos investigadores
na organizao dos seus dados. Contribuir para melhoria da qualidade
dos metadados
7
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Neste contexto
os vocabulrios controlados apresentam-se como uma boa ferramenta,
porque podem definir o contedo admissvel para cada descritor,
contribuindo assim para a simplificao de introduo de conteudo e
controlo de qualidade.
8
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Colaborao com
investigadores muito importante. Pois, s eles podem indicar quais
descritores e quais conceitos para vocabulrios lhes faam mais
sentido e quais so mais utilizveis, assim ajudando a modelar as
ontologias.
9Produo de Hidrognio
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016O primeiro dos
projetos selecionados como caso de estudo o pequeno grupo de
investigadores de dominio de Produo de Hidrognio que partilharam os
seus dados atravs de email e guardaram os nos discos externos.
10
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Durante
entrevistas com investigadores foram identificados as necessidades
e dificuldades deste grupo na gesto dos dados. Assim foram
definidos os descritores para este domnio, criada ontologia,
implementada no Dendro e realizada uma srie de experiencias da
descrio de dados.
11
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os resultados
mostraram existncia dos erros sintticas e gramaticais, descrio
incompleta, tal por exemplo Ovoid e Egg Reactor o mesmo tipo de
reactor, mas essa descrio incompleta pode dificultar interpretao e
reutilizao dos mesmos.
12
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para diminuir os
erros e ter descrio mais completa, em conjunto com os
investigadores foram escolhidos os descritores para criao de
vocabulrios controlados e definidos os conceitos para determinado
descritor.
13
Annotation Property
hasAlternative
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Analisando vrios
estudos e exemplos de ontologias com vocabulrios controlados
decidiu-se modelar os atravs de Annotation Property. Foi criada has
Alternative que uma das alternativas possveis para o valor de um
descritor como conceito de vocabulrio controlado.
14
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Aps a
implementao da ontologia, os descritores com vocabulrios
controlados apaream no Dendro de forma de listas de escolhas com
conceitos definidos.
Assim o investigador abrindo a lista de vocabulrios controlados,
pode com facilidade escolher o conceito certo para a descrio dos
seus dados.
15
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para avaliao de
qualidade de descrio, baseamos na literatura e escolhemos as
mtricas mais apropriados ao nosso estudo e realizamos srie de
analises: uma sem uso de vocabulrios controlados, outro com uso dos
mesmos.
16
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016A comparao dos
resultados de anlises mostra que a maioria dos valores aplicando as
mtricas definidas subiram.
Por exemplo, o valor de qualidade de metadados de descritor
Reactor Type, aplicando a mtrica Correctness passou de 28% para
100%.
17
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016No geral podemos
dizer que a qualidade da descrio aps a implementao dos vocabulrios
controlados melhorou.
As experincias deixaram os investigadores satisfeitos com a
usabilidade da plataforma. Contudo,
18
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016os
investigadores afirmaram que a utilizao de vocabulrios controlados
facilitou o processo da descrio.
Utilizando praticamente a mesma quantidade de descritores tempo
da tarefa da descrio diminuiu.
19
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Baseando nestes
resultados podemos afirmar que os objetivos foram alcanados.
A descrio efetuada com uso de vocabulrios controlados
simplificou todo o processo de criao de metadados, permitiu obter
descries mais completas e corretas, sem o aumento do tempo
necessrio para o efeito.
20exemplo:Expresses Regulares
Annotation Property hasRegEx hasErrorMessage
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Uma das
perspetivas de trabalho futuro elaborao de expresses regulares, que
tambm pode reduzir o esforo manual na introduo da informao e ajudar
na qualidade de dados.
21Muito obrigada!
Dados de investigaoMetadadosDendroMotivao de
investigadoresDesafios na gesto de dados de investigaoVocabulrios
controladosSimplificao de processo de descrioQualidade de
metadados
InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7
Conferncia Luso-Brasileira sobre Acesso Aberto 2016Alem disto,
vamos continuar colaborar e realizar mais experiencias com
investigadores de outros domnios, obtendo assim mais informao que
ajuda nos continuar melhorar o Dendro e essa colaborao ajuda
familiarizar e aumentar interesse dos investigadores nas
atividades, ligadas ao gesto de dados de investigao.
Muito obrigada.