Universidade Estadual Paulista – UNESP A Ciência da Informação e o Ciclo de Vida dos Dados: Fronteiras de Pesquisa Fernando de Assis Rodrigues [email protected]Programa de Pós-Graduação em Ciência da Informação Faculdade de Filosofia e Ciências Marília, SP
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Universidade Estadual Paulista – UNESP
A Ciência da Informação e o Ciclo de Vida dos Dados: Fronteiras de Pesquisa
● Libraries and Scholarly Communication– Linked data principles on
● American Library of Congress● German National Library● OpenLibrary● Europeana
– “Linked Data principles together with the OAI-ORE, Dublin Core, SKOS, and FOAF”
Fernando de Assis Rodrigues - 2013 11
Apresentação do Texto
● 10 years vision:– Linked Data will develop into the standard
technology of sharing scientific data on a global scale and for interconnecting data between different scientific data sources.
– The emerging Web of Linked Data will contain scientific data as well as data from other domains and might become as omnipresent in our daily lives as the classic document Web is today.
Fernando de Assis Rodrigues - 2013 12
Apresentação do Texto
● 10 years vision:– Most open-license scientific data sets will be
directly available as Linked Data on the Web. For extremely large data sets from astronomy or physics for which it is inefficient to generate an RDF representation, the Web of Linked Data will contain detailed metadata that will enable the discovery of these data sets.
Fernando de Assis Rodrigues - 2013 13
Apresentação do Texto
● 10 years vision:– Scientific work environments will have Linked Data
import and export features and will provide for publishing scientific data directly to the Web of Linked Data. Disciplinary repositories of scientific data as well as data archives will provide Linked Data views on the archived data and will thus make their content available on the Web.
Fernando de Assis Rodrigues - 2013 14
Apresentação do Texto
● 10 years vision:– Scientists will navigate along RDF links between
different scientific data sets as well as between publications and supporting experimental data. They will use Linked Data search engines to discover all data on the global scale that is relevant to their question at hand.
Fernando de Assis Rodrigues - 2013 15
Apresentação do Texto
● Challenges– Data Interoperability
– Data Quality
– Scientific Work Environments
– Research on Pay-as-You-Go-Data Integration● Desenvolvimento de ontologias e outros artefatos de
acordo com as necessidades
– Research on Data Quality Assessment in the Web Context
Fernando de Assis Rodrigues - 2013 16
Contexto
Dados daPesquisa
Dataset
Fernando de Assis Rodrigues - 2013 17
Contexualização com CI
● Dados coletados:
– A obtenção dos dados pelo pesquisador deverá ser a priori norteada por um guideline
● 24 meses para um mestrado● 48 meses para um doutorado
● A composição dos dados científicos é originária de diversas áreas da ciência
– CI → estudos de coleta, processamento, armazenamento, (…), acesso a dados...
● Biólogo não deve ter preocupações com Endpoints, SPARQL...
– Ontologias: estudos interdisciplinares com a CI
Fernando de Assis Rodrigues - 2013 18
Contexualização com CI
● Alternativas:– Web Services
– Redução do Cenário:● Área● Nacionalidade
● Recuperação– Ausência e/ou rudimentares sistemas de
informação e recuperação● SPARQL: lentidão
– Cruzamento de 1Tb de dados científicos? (Big Data)
Fernando de Assis Rodrigues - 2013 19
Reflexões
● Enorme gap entre dados científicos e endpoints● Grande número de Datasets inativos, fora do ar
e não atualizados● Linha Tecnologia e Informação (PPGCI)
– Preocupações na coleta de dados com a estrutura de Linked Data