Do documento às ontologias: perspectivas da organização do conhecimento na era da inteligência coletiva I Fórum Nacional de Sistemas de Informação Ministério da Cultura João Pessoa, Outubro de 2015 Profa. Eliany Alvarenga [email protected]Prof. Dalton Martins [email protected]Laboratório de Políticas Públicas Participativas Universidade Federal de Goiás www.l3p.fic.ufg.br
33
Embed
Do documento às ontologias: uma visão sobre sistemas de organização do conhecimento em tempos de inteligência coletiva - I Fórum Nacional de Sistemas de Informação - Ministério
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Do documento às ontologias: perspectivas da organização do conhecimento na era da inteligência coletiva
Universidade Federal de GoiásFaculdade de Informação e ComunicaçãoCurso: Gestão da Informação
Iniciamos com uma questão atual no contexto de um Fórum de Sistemas de Informações:
Como tornar mais acessíveis e mais
inteligentes os crescentes acervos de informação e conhecimento?
É uma questão mais antiga do que parece... Provoca pesquisadores desde os anos 1940....
• (pelo lado dos EUA) Vannevar Bush(1890/1974)- Engenheiro, Inventor ePolítico norte-americano, conhecidopelo seu papel no desenvolvimentoda idéia do MEMEX — visto comoum conceito pioneiro, precursor daworld wide web.
• (pelo lado Europeu) Paul Outlet(1868/1944) Autor, empresário ecriador da Classificação DecimalUniversal. Escritor de diversosensaios e foi criador do InstitutoInternacional de CooperaçãoIntelectual – precursor da UNESCO.Projeto Mundaneum – depósitocentral de informações do mundointeiro.
Vannevar Bush MEMEX
• Por que esta questão surge?• Afinal por que o crescimento documental gerou esta questão?
• Esta questão revela o surgimento de uma “EXPLOSÃO INFORMACIONAL” -crescimento exponencial da informação e de seus registros principalmente naárea de ciência e tecnologia.• O esforço de pesquisa e inovação no período da II Guerra Mundial gera o aumento
exponencial na produção de documentos (artigos, relatórios, indicadores, gráficos,eventos...);
• Como organizar a produção científica e tecnológica de forma a reduzir redundância deesforços e otimizar o tempo/energia dos pesquisadores?
• A era da informação e do conhecimento se inicia como fenômeno humano de produçãosocial.
• A partir da difusão em massa dos computadores e a Internet do final dos anos 90para cá, a explosão informacional se desloca do domínio da ciência para
incluir praticamente todos os fenômenos culturais de produçãoda sociedade.
● Maiores do mundo enfrentarão “crise de informação” até 2017
– Previsão do Gartner aponta que 33% das companhias listadas na Fortune 100 enfrentarão uma crise relacionada a informações até 2017. O problema estará relacionado a sua inabilidade de extrair valor, gerenciar e confiar nos dados que dispõem.
– Para conseguir uma abordagem mais inteligente, a recomendação da consultoria é explorar os pontos cruciais em negócios que estão sustentados sobre um processo fraco de gestão de informação. O segundo ponto é determinar processos e governança organizacionais impactados por essa falha utilização de informações. Feito isso, o passo seguinte é estabelecer prioridades para implantar um programa eficiente.
– Notícia de 28/02/2014 - http://crn.itweb.com.br/49079/maiores-do-mundo-enfrentarao-crise-de-informacao-ate-2017/
• Ciência da Informação• Campo de conhecimento científico que investiga as propriedades e o comportamento da
informação e os meios para organiza-la de forma a otimizar sua acessibilidade e uso.
• Foco nos aspectos humanos e sociais• Surge na década de 1940...
• Ciência da Computação• Foco no processamento de dados e na elaboração de algoritmos de automação e da manipulação
simbólica de dados
• Foco nos aspectos tecnológicos• Surge na década de 1940...
• Os dois campos procuram criar formas de trabalhar a Recuperação da Informação por perspectivas e premissas diferentes....• Ciência da Informação: procura entender como as pessoas usam a informação, como pensam,
como conectam, como criam e produzem conhecimento;• Ciência da Computação: procura modelar algoritmos e processos que gerem redução de
complexidade, síntese e agregação de dados.
Esforços de pesquisa para atender as demandas de explosão informacional
Como pensar algo que facilite a conexão entre a Ciência da Informação e a Computação na
produção de soluções informacionais?
• Gestão da Informação
• É a administração eficaz de todos os recursos de informaçãorelevantes para as organizações, tanto em termos, dos recursosinformacionais gerados internamente, como os recursosinformacionais externos (Choo, 2006).
• Considera que os processos técnicos são geradossocialmente e podem ser orientados a responder problemasconcretos de pessoas e organizações imersas em informação econhecimento.
Ciclo contínuo da Gestão da Informação
MODELO PROCESSUAL DE GESTÃO DA INFORMAÇÃO – CHOO (2006)
1-NECESSIDADES
DE INFORMAÇÃO
3-ORGANIZAÇÃO E ARMAZENAMENTO
DA INFORMAÇÃO
2-AQUISIÇÃO
DE INFORMAÇÃO 4-PRODUTOS E SERVIÇOS
DE INFORMAÇÃO
6-USO DA
INFORMAÇÃO
5-DISTRIBUIÇÃO
DA INFORMAÇÃO
• Na etapa específica da organização e armazenamento da informação envolvem as seguintes habilidades:
• Criação de Mapas de Conhecimentos Especializados;
• Elaboração de Sistemas de Classificação/Indexação dos conhecimentosexplícitos da organização;
• Criação de Sistemas de Organização de Conhecimento e InformaçõesEspecializadas (ONTOLOGIAS, entre outras ferramentas).
• Usada para controlar a variedade entre nomes e entidades;• Não inclui uma organização e nem estrutura complexa;• A apresentação pode ser alfabética ou um simples esquema de organização• Exemplo: nomes de países, nomes de organizações de saúde, etc.
• Glossários:• Lista de termos com definições;• Os termos podem ser de um assunto específico;
• Dicionários:• Lista de palavras em ordem alfabética e suas definições;• Escopo é mais geral que os glossários;• Podem prover informações sobre a origem das palavras, variações quanto a
morfologia e a escrita da palavra e os múltiplos significados nas diferentes áreas.
Classificações
• Classificação, categorização e taxonomia:• Organiza em grupos, segundo diferenças ou semelhanças, em certo número
de classes metodicamente distribuídos.
Grupos de relacionamentoconexão entre termos e conceitos
• Tesauros:• Conjunto de termos representando conceitos e as relações hierárquicas,
equivalentes e associativas entre eles;
• Redes semânticas:
• Estrutura de conceitos e termos em forma de rede, onde os conceitos são os nós e os relacionamentos expandem-se a partir dos nós.
• Ontologia:• Representa relacionamentos complexos entre objetos, não
cobertos por nenhuma outra forma de organização anterior;• Define formalmente as relações entre os termos;• É uma especificação formal e explícita de uma conceitualização.
Exemplos de Tesauros, Redes Semânticas e Ontologias
Rede semântica
Ontologia
Que problemas resolvem essas soluções de organização?
• No geral, são abordagens que apoiam a estruturação, classificação, modelagem e representação de conceitos e relacionamentos.
• Construção de mapas de conhecimento:• Permite a produção de mapas temáticos, indicadores, análises e relatórios de múltiplas
possibilidades de relacionamento da informação
• Navegação para busca da informação:• Produção de facetas filtragem e navegação;• Escolha de termos de busca:
• Apresentação de termos semanticamente relacionados, facilitando aos usuários selecionarem o que melhor representa o que desejam pesquisar ou mesmo a descoberta de relações inesperadas
• Busca integrada:• Permite agregar campos de busca genéricos e específicos.
• Criação de novos conhecimentos a partir do que já existe:• Facilita e incentiva a descoberta de novos relacionamentos informacionais antes desconhecidos,
amplia o potencial de remixagem da informação.
Exemplos mais concretos...
The Gene Ontology
• Um dos maiores esforços colaborativos na produção de uma ontologia mundial;
• Fornece terminologia para descrição consistente de produtos de pesquisa genética em diferentes bases de dados em termos das associações com processos biológicos, componentes celulares e funções moleculares de diferentes espécies.
Observação: os nós em cinza são elementos da ontologia que ainda não foram enriquecidos/comentados pela comunidade.
The Gene Ontology
Google – Mapa do conhecimento
Google Mapa do conhecimento
Choo (2006), ainda salienta que
• “(...) o desafio da Gestão da Informação é planejar e criar estruturas eprocessos de informação que sejam tão flexíveis, energéticase permeáveis quanto os processos de pesquisa e de tomada dedecisões que ela está apoiando”.
• A modelagem de processos de participação e governançadesde a produção a organização da informação e conhecimento é umdesafio contemporâneo para a criação de uma política pública na área desistemas de informação.
Ontologias no MinC – uma visão geral
MinC
SALICMapas
CulturaisTainacan
Dados Abertos
Outros...
OntologiaMinC
Novos serviços e produtos
Editais Temáticos (Digitalização, Pontos de
Cultura, etc...)
Gestores, Parceiros,
consultores, etc...
ParticipantesOntologiaTemática
Outros níveis de governo
Obs: Vamos discutir isso em maior detalhes amanhã no debate sobre construção colaborativa de ontologias