Top Banner
InfoLab - Laboratório de Sistemas de Informação - FEUP/INESC TEC 7ª Conferência Luso-Brasileira sobre Acesso Aberto 2016 Vocabulários controlados na descrição de dados de investigação no Dendro Yulia Karimova [email protected] Faculdade de Engenharia da Universidade do Porto/ INESC TEC
21

Vocabulários Controlados na Descrição de Dados de Investigação no DENDRO

Apr 15, 2017

Download

Science

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript

Apresentao do PowerPoint

Vocabulrios controlados na descrio de dados de investigao no DendroYulia [email protected] de Engenharia da Universidade do Porto/ INESC TEC

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Boa tarde a todos, o meu nome Yulia e fao parte de grupo de investigadores ligados a gesto de dados de investigao na Universidade do Porto.

2

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Com aumento da reutilizao dos dados de investigao a gesto de dados cada vez mais valorizada. Metadados neste contexto tem um papel fundamental, pois dados com descrio mais detalhada so mais fceis de interpretar e reutilizar.

Mas o processo da descrio de dados exigente e demorado e pode desmotivar os investigadores na descrio de dados.

3

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016A falta de tempo, ferramentas adequadas, conhecimentos tambm complicam a descrio de dados.

Por isso importante fornecer as ferramentas que simplificam o processo de criao de metadados.

4

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Reconhecendo essas dificuldades, estamos a desenvolver a plataforma Dendro, que ajuda na organizao e documentao dos dados.

5

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016O Dendro consiste numa interface web e facilita a descrio dos dados com a utilizao de vrios esquemas de metadados existentes, por exemplo Dublin Core,

E tambm descritores criados para domnios de investigao especficos, como por exemplo Produo de Hidrognio.

6

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os objetivos do meu trabalho sa:simplificar e normalizar a descrio de dados na plataforma Dendro.De forma a motivar o interesse dos investigadores na organizao dos seus dados. Contribuir para melhoria da qualidade dos metadados

7

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Neste contexto os vocabulrios controlados apresentam-se como uma boa ferramenta, porque podem definir o contedo admissvel para cada descritor, contribuindo assim para a simplificao de introduo de conteudo e controlo de qualidade.

8

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Colaborao com investigadores muito importante. Pois, s eles podem indicar quais descritores e quais conceitos para vocabulrios lhes faam mais sentido e quais so mais utilizveis, assim ajudando a modelar as ontologias.

9Produo de Hidrognio

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016O primeiro dos projetos selecionados como caso de estudo o pequeno grupo de investigadores de dominio de Produo de Hidrognio que partilharam os seus dados atravs de email e guardaram os nos discos externos.

10

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Durante entrevistas com investigadores foram identificados as necessidades e dificuldades deste grupo na gesto dos dados. Assim foram definidos os descritores para este domnio, criada ontologia, implementada no Dendro e realizada uma srie de experiencias da descrio de dados.

11

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Os resultados mostraram existncia dos erros sintticas e gramaticais, descrio incompleta, tal por exemplo Ovoid e Egg Reactor o mesmo tipo de reactor, mas essa descrio incompleta pode dificultar interpretao e reutilizao dos mesmos.

12

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para diminuir os erros e ter descrio mais completa, em conjunto com os investigadores foram escolhidos os descritores para criao de vocabulrios controlados e definidos os conceitos para determinado descritor.

13

Annotation Property

hasAlternative

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Analisando vrios estudos e exemplos de ontologias com vocabulrios controlados decidiu-se modelar os atravs de Annotation Property. Foi criada has Alternative que uma das alternativas possveis para o valor de um descritor como conceito de vocabulrio controlado.

14

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Aps a implementao da ontologia, os descritores com vocabulrios controlados apaream no Dendro de forma de listas de escolhas com conceitos definidos.

Assim o investigador abrindo a lista de vocabulrios controlados, pode com facilidade escolher o conceito certo para a descrio dos seus dados.

15

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Para avaliao de qualidade de descrio, baseamos na literatura e escolhemos as mtricas mais apropriados ao nosso estudo e realizamos srie de analises: uma sem uso de vocabulrios controlados, outro com uso dos mesmos.

16

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016A comparao dos resultados de anlises mostra que a maioria dos valores aplicando as mtricas definidas subiram.

Por exemplo, o valor de qualidade de metadados de descritor Reactor Type, aplicando a mtrica Correctness passou de 28% para 100%.

17

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016No geral podemos dizer que a qualidade da descrio aps a implementao dos vocabulrios controlados melhorou.

As experincias deixaram os investigadores satisfeitos com a usabilidade da plataforma. Contudo,

18

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016os investigadores afirmaram que a utilizao de vocabulrios controlados facilitou o processo da descrio.

Utilizando praticamente a mesma quantidade de descritores tempo da tarefa da descrio diminuiu.

19

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Baseando nestes resultados podemos afirmar que os objetivos foram alcanados.

A descrio efetuada com uso de vocabulrios controlados simplificou todo o processo de criao de metadados, permitiu obter descries mais completas e corretas, sem o aumento do tempo necessrio para o efeito.

20exemplo:Expresses Regulares

Annotation Property hasRegEx hasErrorMessage

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Uma das perspetivas de trabalho futuro elaborao de expresses regulares, que tambm pode reduzir o esforo manual na introduo da informao e ajudar na qualidade de dados.

21Muito obrigada!

Dados de investigaoMetadadosDendroMotivao de investigadoresDesafios na gesto de dados de investigaoVocabulrios controladosSimplificao de processo de descrioQualidade de metadados

InfoLab - Laboratrio de Sistemas de Informao - FEUP/INESC TEC 7 Conferncia Luso-Brasileira sobre Acesso Aberto 2016Alem disto, vamos continuar colaborar e realizar mais experiencias com investigadores de outros domnios, obtendo assim mais informao que ajuda nos continuar melhorar o Dendro e essa colaborao ajuda familiarizar e aumentar interesse dos investigadores nas atividades, ligadas ao gesto de dados de investigao.

Muito obrigada.