-
BRUNA FAGUNDES RCIO
ESTGIO CURRICULAR I E II Adaptao do Sistema de Busca Semntico ao
Padro
XML e Automatizao do Processo de Modelagem dos
Objetos de Aprendizagem no ROAI para o Padro OWL
EMPRESA: UNIVERSIDADE DO ESTADO DE SANTA CATARINA
SETOR: DEPARTAMENTO DE CINCIAS DA COMPUTAO SUPERVISOR: MARCELO
DA SILVA HOUNSELL
ORIENTADOR: AVANILDE KEMCZINSKI CURSO DE TECNOLOGIA EM ANLISE E
DESENVOLVIMENTO DE
SISTEMAS CENTRO DE CINCIAS TECNOLGIAS - CCT
UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC
JOINVILLE SANTA CATARINA - BRASIL
NOV/2012
-
APROVADO EM ........../........../..........
_________________________________
Professora Avanilde Kemczinski Dra. Engenharia de Produo
Professor Orientador
_________________________________
Professor Alexandre Gonalves Silva Dr. Engenharia Eltrica
_________________________________
Professora Isabela Gasparini Msc. Cincia da Computao
_________________________________
Professor Marcelo da Silva Hounsell Dr. Engenharia de Manufatura
Supervisor da CONCEDENTE
-
Carimbo da Empresa
UNIDADE CONCEDENTE Razo Social: Universidade do Estado de Santa
Catarina UDESC CGC/MF: 83.891.283/0001-36 Endereo: Rua Paulo
Malschitzki, s/n Campus Universitrio Prof. Avelino Marcante Bairro:
Zona Industrial Norte CEP: 89219-710 Cidade: Joinville UF: SC Fone:
(47) 4009-7900 Supervisor: Marcelo da Silva Hounsell Cargo:
Professor Universitrio
ESTAGIRIO Nome : Bruna Fagundes Rcio Matrcula: 211211005
Endereo: Ronco Dgua, 344 Bairro: Itinga CEP: 89233-740 Cidade:
Joinville UF: SC Fone: (47) 8866-0048 Curso de : Tecnologia em
Anlise e Desenvolvimento de Sistemas
Ttulo do Estgio: Adaptao do Sistema de Busca Semntico ao Padro
XML e Automatizao do Processo de Modelagem de Objetos de
Aprendizagem no ROAI para o Padro OWL Perodo: 06/08/2012 a
23/10/2012 Carga horria: 240h
AVALIAO FINAL DO ESTGIO I e II PELO CENTRO DE CINCIAS
TECNOLGICAS
Representada pelo Professor da Disciplina: Omir Alves Junior
CONCEITO FINAL DO ESTGIO I e II
NOTA ETG I (Mdia do Processo)
NOTA ETG II (Mdia do Processo)
Rubrica do Professor da
Disciplina
Excelente (9,1 a 10) Muito Bom (8,1 a 9,0) Joinville Bom (7,1 a
8,0) Regular (5,0 a 7,0) Reprovado (0,0 a 4,9) ____/____/______
-
Nome do Estagirio: Bruna Fagundes Rcio
QUADRO I
AVALIAO NOS ASPECTOS PROFISSIONAIS Pontos QUALIDADE DO TRABALHO:
Considerando o possvel.
ENGENHOSIDADE: Capacidade de sugerir, projetar, executar
modificaes ou inovaes.
CONHECIMENTO: Demonstrado no desenvolvimento das atividades
programadas.
CUMPRIMENTO DAS TAREFAS: Considerar o volume de atividades
dentro do padro razovel.
ESPRITO INQUISITIVO: Disposio demonstrada para aprender.
INICIATIVA: No desenvolvimento das atividades.
SOMA
QUADRO II
AVALIAO DOS ASPECTOS HUMANOS Pontos ASSIDUIDADE: Cumprimento do
horrio e ausncia de faltas.
DISCIPLINA: Observncia das normas internas da Empresa.
SOCIABILIDADE: Facilidade de se integrar com os outros no
ambiente de trabalho.
COOPERAO: Disposio para cooperar com os demais para atender as
atividades.
SENSO DE RESPONSABILIDADE: Zelo pelo material, equipamentos e
bens da empresa.
SOMA
PONTUAO PARA O QUADRO I E II Sofrvel - 1 ponto, Regular - 2
pontos, Bom - 3 pontos, Muito Bom - 4 pontos, Excelente - 5
pontos
LIMITES PARA CONCEITUAO AVALIAO FINAL Pontos
De 57 a 101 SOFRVEL SOMA do Quadro I multiplicada por 7
De 102 a 147 REGULAR SOMA do Quadro II multiplicada por 3
De 148 a 194 BOM SOMA TOTAL
De 195 a 240 - MUITO BOM
De 241 a 285 EXCELENTE
Nome da Empresa: Universidade do Estado de Santa Catarina
Representada pelo Supervisor: Prof. Dr. Marcelo da Silva
Hounsell
CONCEITO CONFORME SOMA
TOTAL
Rubrica do Supervisor da Empresa
Local: Data :
Carimbo da Empresa
-
UDESC
UNIVERSIDADE DO ESTADO DE SANTA CATARINA - UDESC
CENTRO DE CINCIAS TECNOLGICAS - FEJ PLANO DE ESTGIO CURRICULAR I
e II
ESTAGIRIO Nome: Bruna Fagundes Rcio Matrcula: 211211005 Endereo
(Em Jlle): Ronco Dgua, 344 Bairro: Santa Catarina CEP: 89233-740
Cidade: Joinville UF: SC Fone: (47) 8866-0048 E-mail:
[email protected] Regularmente matriculado no semestre: 2012/2
Curso: Tecnologia em Anlise e Desenvolvimento de Sistemas Formatura
(prevista) Semestre/Ano: 2013/2
UNIDADE CONCEDENTE Razo Social: Universidade do Estado de Santa
Catarina - UDESC CNPJ: 83.891.283/0001-36 Endereo: Rua Paulo
Malschitzki, s/n Campus Universitrio Prof. Avelino Marcante Bairro:
Zona Industrial Norte CEP: 89219-710 Cidade: Joinville UF: SC Fone:
(47) 4009-7900 Atividade Principal: Ensino, Pesquisa e Extenso
Supervisor: Marcelo da Silva Hounsell Cargo: Professor Universitrio
E-mail do Supervisor: [email protected] Telefone/Ramal:
7831
DADOS DO ESTGIO rea de atuao: Desenvolvimento de Sistemas no
GPIE Departamento de atuao: Departamento de Cincias da Computao
Fone: (47) 4009-7923 Ramal: Horrio do estgio: Seg Qui 18h s 22h
Total de horas do Estgio: 240 Perodo: 06/08/2012 23/10/2012 Total
de horas semanais: 20
Nome do Professor Orientador: Avanilde Kemczinski Departamento:
Departamento de Cincias da Computao
Disciplina(s) simultnea(s) com o estgio Quantas: 3 Quais: DAD II
Estrutura de Dados II GPR Gerencia de Projetos REC Redes de
Computadores
-
OBJETIVO GERAL
Automatizar o processo de modelagem dos objetos de aprendizagem
cadastrados no ROAI1 para o padro OWL2
ATIVIDADES OBJETIVO ESPECFICO HORAS 1. Levantamento
2. Anlise
3. Implementao
4. Testes
1.1 Levantamento das propriedades necessrias a ontologia de cada
objeto
1.2 Levantamento de projetos similares ao proposto
2.1 Anlise e definio do local de implementao do
desenvolvimento
2.2 Anlise de impacto da implementao no ROAI
2.3 Anlise e definio da necessidade de interface para o gerador
automtico de ontologias
3.1 Implementao do gerador automtico de ontologias para o
ROAI
4.1 Testes integrados no gerador automtico de ontologias para o
ROAI
4.2 Teste de desempenho no ROAI com o gerador automtico de
ontologias
5h
20h
20h
20h
20h
115h
30h
10h
Assinatura do Aluno Assinatura do Supervisor da Empresa
Data: Carimbo da Empresa Data:
Assinatura do Professor Assinatura do Membro do Assinatura do
Orientador Comit de Estgio Coordenador de Estgio
Data: Data: Data:
1 Repositrio de Objetos de Aprendizagem para a rea de
Informtica
2 Ontology Web Language
-
CRONOGRAMA FSICO E REAL
PERODO (20 horas) ATIVIDADES
PR
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20
1. Levantamento das propriedades ontolgicas necessrias a cada P
Objeto R 2. Levantamento de projetos similares ao proposto P R 3.
Anlise e definio do local de implementao do P Desenvolvimento R 4.
Anlise do impacto da implementao no ROAI P R 5. Anlise e definio da
necessidade de interface para o gerador P automtico de ontologias3
R 6. Implementao do gerador automtico de ontologias para o P ROAI4
R 7. Testes integrados no gerador automtico de ontologias para o P
ROAI5 R 8. Teste de desempenho no ROAI com gerador automtico de P
Ontologias R 9. Anlise e estudo interface XML6 P
R 10. Migrao funo busca semntica para a interface XML7 P R
3 Atividade 5 foi atrelada a atividade 2 em virtude da
necessidade da interface depender do modelo de implementao de
modelagem automtica definido
4 Em virtude da adio de atividades e necessidade de
aprofundamento nas pesquisas de projetos relacionados as atividades
de desenvolvimento (6 e 10) e implementao
ainda est em andamento 5 Em virtude da adio de atividades e
necessidade de aprofundamento nas pesquisas de projetos
relacionados as atividades de testes (7 e 8) ainda no foram
realizadas
6 Atividade 9 no faz parte do escopo inicial
7 Atividade 10 no faz parte do escopo inicial
-
Aos meus pais e
Aos meus irmos (aos que compartilho meu amor e DNA E no menos
importante, aos que compartilho
somente o meu amor e admirao)
-
AGRADECIMENTOS
Por mais inteligentes, corajosos e fortes que possamos ser,
ainda assim acredito que no seramos nada sozinhos, assim, aqui,
gostaria de lembrar e agradecer algumas pessoas que contriburam, no
somente a esse trabalho, mas tambm para que eu me tornasse quem eu
vim a ser.
Aos meus pais pela educao, moral e tica que me ajudaram a
construir nesses vinte e quatro anos e por terem cuidado de mim em
todas as vezes que precisei.
Aos meus irmos. Aos que vi nascer e aos que ganhei com o
passar
dos anos, por mais que nossas diferenas possam ser grandes, o
amor que eu sinto por vocs maior que a extenso do universo, e
qualquer coisa se torna insignificante perante isso.
A minha equipe na TOTVS (Silvia, Tati, Fer, Gil, Bortto e
Karina), pessoas que tem minha admirao, carinho, respeito, que
agentam a minha hiperatividade h quase trs anos e que sempre
apoiaram meus sonhos.
A professora Avanilde, por ter me apresentado a pesquisa, por
ter permitido que eu viesse a ser parte do GPIE, por ter me apoiado
e acredito no meu potencial, por entender meus horrios restritos...
enfim, por tudo. Que um dia eu possa ser ao menos metade do que voc
.
A todos os meus professores, dos dezoito anos de vida acadmica,
o meu muito obrigado. Dentre os diversos caminhos que eu testei,
antes de enfim encontrar o que eu realmente procurava, eu tive
oportunidade que conhecer verdadeiros mestres.
A toda a galera da UDESC, por todos os momentos bons churrasco,
papo furado, piadas e desesperadores provas, trabalhos e mais
provas pra fechar bem.
A UDESC, por ser uma instituio que incentiva e instiga a
pesquisa e o conhecimento cientfico.
-
Talvez alguns nomes tenham ficado pelo caminho no texto acima,
por isso, fica aqui registrado o meu muito obrigado a todos que de
uma forma ou outra contriburam para que eu estivesse aqui.
Menor que meu sonho no posso ser Lindolf Bell
-
SUMRIO 1. INTRODUO
1.1. OBJETIVOS 1.1.1. Geral
................................................................................................................
1 1.1.2. Especficos
......................................................................................................
1 1.1.3. Justificativa
.....................................................................................................
2
1.2. ORGANIZAO DO
ESTUDO...........................................................................
2 2. A EMPRESA
2.1. HISTRICO
..........................................................................................................
3 2.2. CURSOS OFERECIDOS
......................................................................................
3 2.3. GPIE
.......................................................................................................................
4 2.4. CONSIDERAES GERAIS
...............................................................................
4
3. DESENVOLVIMENTO 3.1. ROAI
......................................................................................................................
6 3.2 WEB SEMNTICA
...............................................................................................
7 3.3. ONTOLOGIA
........................................................................................................
8 3.4. BUSCA SEMNTICA COM O USO DE ONTOLOGIA NO ROAI
.................. 9 3.5. CONSIDERAES GERAIS
.............................................................................
14
4. BUSCA SEMNTICA NA INTERFACE XML
....................................................... 15 4.1
MANAKIN
...........................................................................................................
18 4.2 CONSIDERAES GERAIS
..............................................................................
24 5. AUTOMATIZAO DA MODELAGEM DE OBJETOS DE APRENDIZAGEM
PARA O PADRO OWL
..........................................................................................
25 5.1 MODELAGEM ATUAL DE OBJETOS DE APRENDIZAGEM PARA O
PADRO OWL
..........................................................................................................
25 5.2 LEVANTAMENTO DAS PROPRIEDADES ONTOLGICAS
........................ 26 5.3 TRABALHOS RELACIONADOS
......................................................................
28 5.4 OAI-PMH
.............................................................................................................
29 5.5 POPULANDO ARQUIVO DE ONTOLOGIA COM A INTERFACE OAI .......
35 5.5.1 Transformando a entrada OAI-PMH em Ontologia
OWL...........................36 5.6 CONSIDERAES GERAIS
..............................................................................
38 CONSIDERAES FINAIS
.........................................................................................
39 ANEXOS
........................................................................................................................
40 GLOSSRIO
..................................................................................................................
43 REFERNCIAS BIBLIOGRFICAS
...........................................................................
45
-
LISTA DE FIGURAS
Figura 1. OntoROAI
.....................................................................................................
13 Figura 2. Interface de Busca Semntica
.....................................................................
14 Figura 3. Trecho do arquivo ROAI.owl
......................................................................
15 Figura 4. Interface JSP
.................................................................................................
16 Figura 5. Interface XML ROAI
...................................................................................
17 Figura 6. Localizao de fontes responsveis por funes
........................................ 19 Figura 7. Localizao de
fontes responsveis por interface
...................................... 20 Figura 8. Localizao dos
arquivos de definio de estilo
......................................... 21 Figura 9. Arquivos
gerados pela implementao de busca semntica na interface
JSP
..............................................................................................................................
22 Figura 10. Nova Tela Pgina Inicial ROAI
................................................................ 23
Figura 11. Nova Tela Resultados Busca Semntica (Simples)
.................................. 23 Figura 12. Requisio interface
OAI
...........................................................................
33 Figura 13. Funo Harvesting no Painel de Controle do ROAI
............................... 34 Figura 14. Repositrio de Objetos
Universidade de Patras ...................................... 36
Figura 15. Envio de informaes ao Transformation
................................................. 37
-
LISTA DE TABELAS
Quadro 1. Metadados Essenciais
...................................................................................
7 Quadro 2. Definio das classes OWL dos elementos estruturais do
DSpace ......... 10 Quadro 3. Definio das classes OWL dos metadados
essenciais e adicionais ....... 11 Quadro 4. Classes adicionais
ontologias
.....................................................................
12 Quadro 5. Propriedade URL
.......................................................................................
12 Quadro 6. Propriedade Relation
.................................................................................
12 Quadro 7. Mapeamento Cruzado Cadastro X Classes Ontolgicas
........................ 27 Quadro 8. Anlise dos aspectos
relevantes dos trabalhos relacionados com foco em
semntica e ontologia.
...............................................................................................
29
-
RESUMO
Neste relatrio so detalhadas as atividades realizadas pela
acadmica Bruna Fagundes Rcio no Grupo de Pesquisa em Informtica na
Educao (GPIE) no Departamento de Cincias da Computao da
Universidade do Estado de Santa Catarina UDESC, em virtude das
disciplinas de Estgio Curricular Obrigatrio I e II do curso de
Tecnologia em Anlise e Desenvolvimento de Sistemas. O trabalho
proposto tem origem na continuidade de uma pesquisa que
proporcionou ao Repositrio de Objetos de Aprendizagem para a rea de
Informtica ROAI a funcionalidade de busca semntica. Sendo assim,
este projeto, permitiu aos envolvidos o conhecimento do repositrio,
das ferramentas envolvidas e da aplicao dos conceitos como busca
semntica e ontologia.
-
1. INTRODUO
O ROAI Repositrio de Objetos de Aprendizagem para a rea de
Informtica tem por finalidade organizar, catalogar e armazenar
objetos que facilitem o processo de aprendizagem na rea de
Informtica, disponvel em: http://roai.joinville.udesc.br. Esse
relatrio tem o intuito de detalhar as atividades realizadas pela
acadmica Bruna Fagundes Rcio nessa ferramenta no perodo entre
06/08/2012 e 23/10/2011, no Grupo de Pesquisa em Informtica na
Educao do Departamento de Cincias da Computao da Universidade de
Estado de Santa Catarina UDESC.
1.1. OBJETIVOS
1.1.1. Geral
Automatizar o processo de modelagem dos objetos de aprendizagem
cadastrados no ROAI para o padro OWL.
1.1.2. Especficos
Levantamento das propriedades necessrias a ontologia de cada
objeto Levantamento de projetos similares ao proposto Anlise e
definio do local de implementao do desenvolvimento Anlise de
impacto da implementao no ROAI Anlise e definio da necessidade de
interface para o gerador automtico de
ontologias
Implementao do gerador automtico de ontologias para o ROAI
Testes integrados no gerador automtico de ontologias para o ROAI
Teste de desempenho no ROAI com o gerador automtico de
ontologias
-
1.1.3. Justificativa
Na situao atual do repositrio necessrio que cada objeto incluso
seja mapeado manualmente e adicionado ao arquivo de informaes
ontolgicas. No caso da excluso de um objeto tambm preciso excluir
as referencias dele no mesmo arquivo. Isso, alm de ser invivel pelo
esforo humano necessrio, pode ocasionar problemas com a integridade
das informaes ontolgicas do objeto, pois, em um trabalho manual
maior a possibilidade de ser esquecida uma das classes ou at mesmo
danificar as informaes de algum outro objeto no processo de
excluso. Para essa situao, foi planejada como soluo a automatizao
da modelagem de objetos de aprendizagem para o padro OWL. Porm,
tambm foi observado que a funo de busca semntica estava disponvel
apenas para a interface conhecida como JSP e que no a padro do
repositrio (ROAI). Por questes de usabilidade e manuteno, foi
proposta tambm a migrao da funo de busca semntica para a interface
oficial do repositrio (padro XML).
1.2. ORGANIZAO DO ESTUDO
O relatrio est dividido em sete captulos. O primeiro descreve os
objetivos geral e especficos, alm da justificativa do trabalho.
O segundo engloba as informaes sobre a empresa onde o estgio foi
realizado, apresentando o histrico, fatos relevantes e consideraes
gerais.
O terceiro captulo apresenta a base conceitual, cujo
conhecimento foi imprescindvel para a realizao do objetivo
proposto.
O quarto e quinto captulo tratam do detalhamento das tarefas
desenvolvidas durante o perodo de estgio.
O sexto captulo traz as concluses, seguidas por referncias
bibliogrficas e anexos.
-
2. A EMPRESA
Este captulo apresenta um breve histrico do CCT - Centro de
Cincias Tecnolgicas, localizado em Joinville e pertencente UDESC,
abordando os seus principais cursos e consideraes gerais.
apresentado o GPIE (Grupo de Pesquisa em Informtica na Educao),
local de execuo do estgio, tratando de seu histrico, linhas de
pesquisa e destacando projetos realizados e em desenvolvimento.
2.1. HISTRICO
Inicialmente denominado FEJ Faculdade de Engenharia de
Joinville, foi criado em 09 de outubro de 1956 pelo governo do
Estado de Santa Catarina, atravs da Lei n 1520/56 o Centro de
Cincias Tecnolgicas (CCT), com apenas o curso de Engenharia de
Operaes, modalidade Mecnica de Mquinas e Motores. O primeiro
vestibular foi realizado em julho de 1965, com as atividades do
curso tendo inicio em 1 de agosto do mesmo ano (UDESC Joinville,
2012). As atividades da FEJ eram realizadas na rua Otto Boehm,
nmero 48, no centro de Joinville onde atualmente opera a Rdio Udesc
FM e a Fundao Softville at 8 de maro de 1979, quando foi inaugurado
o campus universitrio professor Avelino Marcante, onde as
atividades passaram a ser desenvolvidas (UDESC Joinville,
2012).
Em 1 de outubro de 1990, o governo do Estado de Santa Catarina,
atravs da Lei n 8092, reconheceu a Faculdade de Engenharia de
Joinville como Universidade, passando a se chamar Centro de Cincias
Tecnolgicas (UDESC Joinville, 2012).
2.2. CURSOS OFERECIDOS
O Centro de Cincias Tecnolgicas disponibiliza atualmente nove
cursos: Engenharia Civil, Engenharia Eltrica, Engenharia Mecnica,
Engenharia de Produo e Sistemas, Cincia da Computao, Licenciatura
em Fsica, Licenciatura em Matemtica, Licenciatura em Qumica e
Tecnologia em Anlise e Desenvolvimento de Sistemas (UDESC
Joinville, 2012).
-
So oferecidos seis cursos gratuitos de ps-graduao em nvel de
mestrado: Computao Aplicada, Fsica, Cincia e Engenharia de
Materiais, Engenharia Mecnica e Engenharia Eltrica, este ultimo nas
modalidades acadmico e profissional. H tambm o curso de ps-graduao,
em nvel de doutorado, em Cincia e Engenharia de Materiais (UDESC
Joinville, 2012).
O CCT tambm desenvolve e apia aes destinadas a comunidade em
geral a partir de projetos de extenso, como o Informtica na
Terceira Idade e Informtica para Escolas Pblicas, que promovem a
incluso digital a idosos e alunos de escolas carentes municipais e
estaduais da regio de Joinville. Alm disso, figuram projetos como
Universidade para Idosos e Entendendo Fsica para o vestibular
(UDESC Joinville, 2012).
2.3. GPIE
Com o nome de Sistemas de Informao e Gesto do Conhecimento o
grupo foi oficializado no CNPq em 10 de Abril de 2002. Ao final do
mesmo ano passou a se chamar Grupo de Pesquisa em Informtica na
Educao - GPIE. Localizado no Departamento de Cincia da Computao, do
Centro de Cincias Tecnolgicas, da Universidade do Estado de Santa
Catarina, em Joinville, seu primeiro laboratrio, o LINE Laboratrio
de Informtica na Educao foi inaugurado em dezembro de 2007 (GPIE,
2007).
O grupo conta atualmente com cinco professores, treze alunos e
sete
colaboradores vinculados em duas linhas de pesquisa, sendo elas:
(1) Ensino-Aprendizagem auxiliado por Computador e (2) Tecnologia
Educacional.
2.4. CONSIDERAES GERAIS
Dentre os projetos de pesquisa do GPIE, o ROAI proposto por
Ferlin (2009) intitulado Repositrio de Objetos de Aprendizagem para
a rea de Computao e Informtica, pertencente a linha de
Ensino-Aprendizagem auxiliado por Computador. Esse projeto tratou
do estudo da melhor forma de implementao do repositrio e da
implantao em si. Outros dois projetos que trouxeram melhorias
importantes para o
-
repositrio foram o Processo de Avaliao de Objetos de
Aprendizagem no ROAI utilizando Workflow, que visou aumentar a
qualidade dos objetos submetidos, fazendo com que eles fossem
analisados por avaliadores tcnicos e pedaggicos, antes da
disponibilizao na base, proposto por Woll (2011). E por ltimo, o
projeto Busca Semntica no Repositrio de Objetos de Aprendizagem
para a rea de Informtica, proposto por Kochhann (2012) para
qualificar os resultados nas buscas de objetos.
Neste trabalho, a proposta trazer a busca semntica para a
interface oficial do ROAI que a padro XML e agregar ao repositrio
uma funo que permita a modelagem automtica dos objetos de
aprendizagem para o padro OWL. Tarefa indispensvel para o
funcionamento da busca semntica e que hoje feito de forma
manual.
-
3. DESENVOLVIMENTO
Este captulo aborda os conceitos necessrios para o entendimento
e justificativa do projeto.
3.1. ROAI
O Repositrio de Objetos de Aprendizagem para a rea de Informtica
ROAI foi proposto em 2009 por Ferlin (FERLIN, 2009) como uma soluo
para centralizar e catalogar objetos uteis ao processo de ensino e
aprendizagem na rea de informtica. O ROAI usou como base o
gerenciador de repositrios opensource DSpace (DSpace, 2012) que usa
como padro de metadados o Dublin Core e como motor de busca o
Apache Lucene (Apache, 2012).
Uma das premissas do projeto era oferecer um sistema eficaz nas
tarefas de catalogar e recuperar objetos e que fizesse uso do mnimo
de informaes possveis, otimizando no somente organizao dos dados,
como tambm no onerando o usurio no momento da incluso de um novo
objeto.
Respeitando essa premissa, Ferlin (2009) observou e identificou
quais metadados eram parte da composio da maior parte dos padres. A
partir da escolha do Dublin Core como padro, visando a eficincia da
pesquisa dos objetos dentro do repositrio, Ferlin (2009),
selecionou apenas os metadados que a maior parte dos outros padres
possussem em comum e que contivessem, adequadamente, todas as
informaes necessrias, no s para o armazenamento dos objetos, como
tambm para sua recuperao. Os metadados resultantes dessa anlise
foram denominados metadados essenciais (Kemczinski, 2010) e so
apresentados no Quadro 1.
Nome do Metadado
Entrada (Entry) Ttulo (Title)
Idioma (Language) Descrio (Description)
Criador (Creator)
-
7
Data (Date) Formato (Format) Tamanho (Extent)
Tipo do Recurso de Aprendizagem (Type) Direitos (Rights)
Quadro 1. Metadados Essenciais
O motor de busca vinculado ao gerenciador de repositrios o
Lucene, desenvolvido na linguagem Java e mantido pela APACHE
SOFTWARE FOUNDATION (2011), cuja caracterstica principal a obteno
de qualquer informao indexada desde que esta atenda a premissa de
poder ser convertida para o formato texto. No caso de objetos de
tipo diferente de texto, por exemplo, vdeos, animaes e imagens a
busca concentra-se nas informaes contidas no metadado do objeto. A
busca por palavra-chave perde eficcia quando se trabalha com
grandes volumes de dados ou palavras-chave que se referem a termos
muito amplos. Por exemplo, em um repositrio de objetos de
aprendizagem para a rea de informtica certamente sero encontrados
muitos objetos com o termo engenharia de software, porm, boa parte
desses objetos na verdade no so sobre engenharia de software,
apenas tem o termo mencionado em algum momento. Ento como
identificar quais objetos so realmente sobre o termo pesquisado? A
web semntica foi proposta como soluo para situaes como esta e seu
conceito detalhado na seo 3.2.
3.2. WEB SEMNTICA
A evoluo e crescimento da World Wide Web permitiu observar que
os padres at ento utilizados para recuperao de informaes no so
eficazes. Como relata Engehofer (2002), os meios de obteno de
informao existentes hoje so limitados a buscas por palavras-chave
ou sub-palavras (substrings) assim como o motor de busca do ROAI
sem oferecer suporte a estruturas mais abrangentes que podem estar
escondidas na informao ou que as pessoas geralmente utilizam para
raciocinar e direcionar sua pesquisa.
-
8
Considerando o fato de que uma quantidade incalculvel de
informaes relevantes por ser perdida por causa disso, foi proposto
um conjunto de padres denominados Web Semntica que visam permitir
que existam dados atrelados as informaes pesquisadas, de forma que
seja possvel a interpretao por parte da mquina para a melhor
escolha e gerenciamento dos resultados.
Este conceito visa encontrar uma soluo para a situao citada por
Berners-Lee (1998), que diz a fonte destes problemas est no fato de
que a web, da maneira atual, projetada de forma que a informao seja
consumida apenas por seres humanos, pois a estrutura dos dados no
permite que uma aplicao interprete o seu significado, mesmo quando
esta informao se origine de um banco de dados com significados bem
definidos.
Assim, Berners-Lee (2001) props a adio na web de informaes
processveis por software que possam auxiliar o usurio. Com isso,
uma informao processada de forma coerente por um software
especializado resultaria em dados mais relevantes e precisos. Porm,
a web semntica trata-se apenas do conceito, para a real otimizao
das buscas necessria uma forma de identificar o relacionamento
semntico entre os objetos e que este possa ser identificado por um
motor de busca. E essa a funo da chamada ontologia, tornar aplicvel
o conceito de web semntica em sistemas informatizados reais, como
repositrios de objetos.
3.3. ONTOLOGIA
A definio genrica de ontologia diz que se trata de uma
"especificao explcita e formal de uma conceitualizao compartilhada"
(Gruber, 1993). Ou seja, a referncia a um modelo abstrato de como
algo especfico deveria ser. Continuando com a definio proposta por
Gruber, as ontologias teriam todos os seus conceitos e
relacionamentos nomeados de forma explcita.
Existem inmeras definies diferentes para ontologia. Porm,
visando seu uso junto a mecanismos de busca e web semntica, aceita
a definio de que uma ontologia a descrio formal de um domnio de
discurso, cujo objetivo compartilhar a informao entre aplicativos
diferentes, sendo esta informao expressada em uma linguagem passvel
de raciocnio (Welty, 2003).
-
9
Figuram entre essas linguagens (W3C, 2012): RDF (Resource
Description Framework): padro de definio e manipulao
de metadados para ser embutido na codificao XML. o que na
verdade atribui ao XML propriedade semntica, porque, por mais bem
modelado e especificado que seja o arquivo, suas tags so de fcil
entendimento humano, porm, no traduzveis para a mquina.
OWL (Ontololy Web Language): considerado superior ao RDF, e
baseada no formalismo de Lgica Descritiva, o que tida como sua
maior vantagem, pois a lgica descritiva um campo bem fundamento, de
acordo com Plisson et al. (2006).
A linguagem padro proposta pela W3C a OWL. Por isso, foi
decidido utilizar esse padro tambm na implementao de busca semntica
no ROAI, pois, tratando-se de uma linguagem padronizada existe mais
suporte, conhecimento disseminado e tambm uma gama maior de projeto
que a usam, tornando possvel comparaes e facilitando a coleta de
informaes para se obter o melhor desempenho.
3.4. BUSCA SEMNTICA COM O USO DE ONTOLOGIA NO ROAI
Desde a sua implantao em 2009, esse repositrio sofreu alteraes
visando proporcionar um melhor uso por parte de usurios. Com a
inteno de oferecer a melhor qualidade possvel para os usurios da
ferramenta, foi notada a grande melhoria que uma busca semntica
poderia proporcionar, listando objetos cujo contedo conivente o
esperado, tendo em vista a grande quantidade de termos de duplo ou
mltiplo sentido que podem ser usados como palavras chave em uma
busca.
A partir da oportunidade de melhoria identificada, Kochhann
(2012) realizou um estudo e posteriormente implementou junto a
outros integrantes do GPIE (GPIE, 2012) um sistema de busca
semntica com o uso de ontologia no ROAI.
Nesse estudo, foram identificados dois pontos crticos: os
metadados essenciais (Kemczinski, 2010) no ofereciam dados o
suficiente para a aplicao de busca semntica e o motor de busca
LUCENE tambm no tinha suporte a busca semntica. Assim, um dos
passos principais, foi a pesquisa por projetos repositrios
similares ao ROAI, que usavam o padro de metadados Dublin Core e
que oferecessem busca
-
10
semntica ao usurio, pois com bases em estudos j realizados e
documentados o processo de implementao da nossa funcionalidade
seria menos arriscado em relao a integridade dos dados j
armazenados. Como resultado da pesquisa, o modelo escolhido e
adaptado foi o proposto por Koutsomitropoulos et al. (2009), pois
foi o que mais se assemelhou a estrutura do ROAI. O modelo proposto
se centra no mapeamento entre os elementos estruturais oriundos do
DSpace (Comunidade, Coleo e Itens) em OWL, representados no quadro
2.
Classes e Subclasses Descrio
-
11
Formato (Format)
Tamanho (Extent)
Direitos (Rights)
Metadados Adicionais (Koutsomitropoulos et al. (2009))
Representao OWL
Contribuinte (Contributor)
Relao (Relation)
Parte de (isPartOf)
Tem parte (hasPart)
Quadro 3. Definio das classes OWL dos metadados essenciais e
adicionais.
Contudo, a aplicao do modelo utilizado por Koutsomitropoulos et
al. (2009) no foi o suficiente para suprir os objetivos propostos
pelo projeto de aplicao de busca semntica, isso se deve ao fato de
que as propriedades OWL so aplicadas a um objeto atravs de
instncias de uma classe. Por exemplo, para atribuir o tipo a um
objeto (texto, imagem, etc), necessrio criar uma instncia de alguma
classe que represente os tipos. Assim, foi proposta a criao de
classes OWL adicionais apresentadas no quadro 4 - que fomentaram
esse mapeamento.
Autores dos objetos de aprendizagem.
Tipos de dados (imagem, texto, etc) dos objetos de
aprendizagem.
Datas de publicao dos objetos de aprendizagem. Descrio dos
objetos de aprendizagem. Direitos autorais dos objetos de
aprendizagem. Constante numrica nica, que identifica cada objeto.
Formato do objeto (TXT, PDF, etc) Idioma do objeto de
aprendizagem.
Tamanho do objeto.
-
12
Quadro 4. Classes adicionais ontologias
Alm de classes, foi criada uma propriedade adicional
especificada no quadro 5 para tornar vivel o armazenamento da URI
do objeto de aprendizagem no ROAI. Com essa informao agregada ao
objeto possvel efetuar sua visualizao assim que for retornado pela
busca semntica, configurando um melhor desempenho.
Propriedade Descrio
owl:DatatypeProperty
rdf:about="http://www.semanticweb.org/ontologies/2012/4/ROAIFinal.owl#URL
Armazena a URL
de um objeto no ROAI
Quadro 5. Propriedade URL
Para enriquecer o relacionamento entre os objetos foi
estabelecida a noo de simetria e transitividade, assim como
proposta por Koutsomitropoulos el al. (2009) no quadro 6.
Propriedade Representao OWL Descrio
Relation
Estabelece que a
propriedade
Relation simtrica e
transitiva.
Quadro 6. Propriedade Relation
A propriedade relation foi utilizada para criar o relacionamento
de um objeto de aprendizagem a outro. Ao assumir que esta
propriedade simtrica, o motor de busca semntica pode retornar
objetos de aprendizagem que esto diretamente relacionados entre si.
Alm disso, ao dizer que a propriedade transitiva, o motor de busca
pode retornar objetos indiretamente relacionados. A propriedade
isPartOf utilizada para dizer que um determinado objeto pertence a
uma determinada coleo e a hasPart, faz o caminho inverso dizendo
que certa Coleo possui determinado objeto. E por fim, o metadado
adicional contributor utilizado para ser possvel trazer todos os
objetos de um autor em especial.
-
Essas definies e mapeamentos foram da ontologia aplicada ao ROAI
e que pode ser visualizada na figura 1, onde representa um objeto
qualquer
Com toda a modelagem de dados realizada foi necessrio tambm
pesquisar por uma engine que suportasse busca semntica, mas, ao
mesmo tempo no prejudicasse o funcionamento do LUCENE de maneira
alguma, pois, esse continuaria sendo o responsvel pelas
buscasescolhido foi o HermiT. O HermiT se trata de um motor de
busca que usa as classes OWL para efetuar a busca. De forma
simplificada o HermiT acessa o arquivo com as classes OWL dos
objetos do repositrio entrada com as informaes
O Dspace aplicao base do ROAI uma XML e outra JSP. Por
facilidade de programao, considepara a implementao do projeto, a
funcionalidade de busca semntica com o uso de ontologia foi
desenvolvido na interface JSP, como mostra a figura 2.
8 Nome dado a ontologia aplicada ao ROAI
es e mapeamentos foram a base de dados utilizada para a da
ontologia aplicada ao ROAI e que pode ser visualizada na figura 1,
onde
um objeto qualquer.
Figura 1. OntoROAI8
Com toda a modelagem de dados realizada foi necessrio tambm
pesquisar por que suportasse busca semntica, mas, ao mesmo tempo no
prejudicasse o
funcionamento do LUCENE de maneira alguma, pois, esse
continuaria sendo o responsvel pelas buscas convencionais baseadas
em palavras chave. Assim, o escolhido foi o HermiT. O HermiT se
trata de um motor de busca que usa as classes OWL para efetuar a
busca. De forma simplificada o HermiT acessa o arquivo com as
classes OWL dos objetos do repositrio e faz sua seleo comparando o
valor de entrada com as informaes especificadas em cada classe
sobre os objetos.
aplicao base do ROAI oferece dois tipos distintos de interface,
uma XML e outra JSP. Por facilidade de programao, considerando o
tempo limitado para a implementao do projeto, a funcionalidade de
busca semntica com o uso de ontologia foi desenvolvido na interface
JSP, como mostra a figura 2.
Nome dado a ontologia aplicada ao ROAI
13
base de dados utilizada para a gerao da ontologia aplicada ao
ROAI e que pode ser visualizada na figura 1, onde Thing
Com toda a modelagem de dados realizada foi necessrio tambm
pesquisar por que suportasse busca semntica, mas, ao mesmo tempo no
prejudicasse o
funcionamento do LUCENE de maneira alguma, pois, esse
continuaria sendo o baseadas em palavras chave. Assim, o
escolhido foi o HermiT. O HermiT se trata de um motor de busca
que usa as classes OWL para efetuar a busca. De forma simplificada
o HermiT acessa o arquivo com as
e faz sua seleo comparando o valor de sobre os objetos.
oferece dois tipos distintos de interface, rando o tempo
limitado
para a implementao do projeto, a funcionalidade de busca
semntica com o uso de
-
14
Figura 2. Interface de Busca Semntica
3.5. CONSIDERAES GERAIS
Os conceitos utilizados para a implementao de busca semntica no
ROAI foram apresentados neste capitulo. Conforme citado no final da
seo 3.4, a implementao da aplicao semntica, foi realizada na
interface JSP do ROAI, que conserva o mesmo layout e funes da
ferramenta base: o Dspace. Nas atividades do primeiro ms de estgio,
foi identificado que no possvel manter funes separadas em dois
ambientes, o usurio seria onerado e o repositrio perderia parte de
seu propsito que a centralizao de recursos e informaes. Assim, a
equipe responsvel pela construo da funo responsvel pela automatizao
da modelagem dos objetos de aprendizagem para o padro OWL, decidiu
realizar o estudo e migrao da funo semntica para interface XML.
Essa nova tarefa est detalhada na prxima seo.
-
4. BUSCA SEMNTICA NA INTERFACE XML
Inicialmente, o objetivo proposto no estgio configurava apenas
na construo e implantao de um gerador automtico de ontologias para
o ROAI, tendo em vista que seria necessrio inserir manualmente as
classes OWL no arquivo de ontologia, alm de criar os
relacionamentos entre os objetos nesse mesmo arquivo. A figura 3
apresenta exemplos de trechos de cdigos contidos no arquivo
ROAI.owl9, que pode ser alterado por editores de texto, como o
Notepad do Sistema Operacional Windows ou pelo prprio Proteg
Software (Stanford, 2012), que uma ferramenta mantida pela
Universidade de Stanford para a edio de arquivos OWL, RDF e XML
Schema, na qual a ontologia aplicada ao ROAI foi modelada.
Figura 3. Trecho do arquivo ROAI.owl
Contudo, na etapa de anlise de local de implementao, definida no
cronograma desse projeto, foi identificado que a interface JSP
oferecia menos qualidade (usabilidade), alm de no ser padro do ROAI
usada por padro a interface XML, isso foi definido por Ferlin
(2009) na ocasio de implementao do repositrio. Sendo assim, foi
realizada uma anlise para definir se era mais vivel a total migrao
do
9 Arquivo que contm a discriminao das classes ontolgicas para
cada objeto armazenado no ROAI
-
ROAI para a interface JSP apresentada na figura 4 ou a
implementao da busca semntica na interface XML figura 5. importante
salientar tambm que, at o projeto de implementao de busca semntica
no ROAI, a interface JSP no era disponibilizada para acessos ao
repositrio. Sua instalao foi feita durante o processo de implantao
da funo de busca semntica e sendo assim, ela mantm todas as
caractersticas de uma instalao default do Dspace, ou seja, sem
qualquer customizao ou adaptao de acordo com o propsito do
repositrio que utiliza a ferramenta.
Figura 4. Interface JSP
-
Figura 5. Interface XML ROAI
Diante de uma anlise entre as duas interfaces, possvel perceber
que o layout e organizao da interface XML do ROAI oferece mais
usabilidade ao usurio, pois, a interface na qual Ferlin (2009) e
Woll(2011) trabalharam seus projetos de pesquisa. Assim, a equipe
concluiu que seria mais produtivo estudar o cdigo fonte responsvel
pela interface XML, com o intuito de adicionar a essa interface a
funo de busca semntica e tambm j deter o conhecimento de manipulao
da interface para a parte de automatizao da modelagem dos objetos
de aprendizagem para o padro OWL, pois caso contrrio, seria
necessrio conhecer melhor o cdigo fonte da interface JSP, filtrar
todas as alteraes feitas desde a implantao at agosto/2012, data na
qual se iniciou esse projeto, e transferi-las a outra interface, o
que em tese, demandaria muito mais tempo, por se tratar de um
volume significantemente maior de alteraes (funcionalidades,
interface e interao).
-
4.1 MANAKIN
A DSpace define o Manakin como uma interface de usurio baseada
em web que introduz o conceito de camadas ao Dspace (Duraspace,
2012). De forma simples e direta, existe uma parte responsvel pela
interface e outra pelas funes do repositrio, e elas so mantidas
separadamente. Como exemplo, a figura 6 traz o local onde se
localizam os fontes responsveis pelas funes do repositrio,
separados em macro grupos de acordo com o propsito, ex:
Administrao, Navegao. Os fontes apresentados abaixo pertencem a uma
instalao do DSpace puro verso 1.7.1 a mesma utilizada no ROAI num
ambiente Linux Ubuntu 11.04, o caminho completo do diretrio
[diretorio]10\dspace-1.7.1-src-release\dspace-xmlui\dspace-xmlui-api\src\main\java\org\dspace\app\xmlui\aspect.
Figura 6. Localizao de fontes responsveis por funes.
Existem quatro temas possveis para o Manakin, o ROAI usa o
default, cujos arquivos so apresentados na figura 7. Seu caminho
completo
[diretorio]\dspace-1.7.1-src-release\dspace-xmlui\dspace-xmlui-webapp\src\main\webapp\themes
\dri2xhtml. Alm disso, para a parte de interface, tambm se faz uso
de arquivo de definio de estilo, que so apresentados na figura 8 e
localizados no caminho
10 Diretrio onde os fontes do Dspace foram descompactados
-
[diretorio]\dspace-1.7.1-src-release\dspace-xmlui\dspace-xmlui-webapp\src\main
\webapp\themes\Reference\lib.
Figura 7. Localizao de fontes responsveis por interface.
Figura 8. Localizao dos arquivos de definio de estilo.
Para alteraes somente na interface necessrio apenas ter o
conhecimento de XML, XLS e CSS (arquivos de estilo), porm, caso for
preciso fazer alteraes nas funes ou criar novas, necessrio o
conhecimento da linguagem Java e SQL.
-
Analisando os arquivos oriundos da implementao da funo de busca
semntica na interface JSP foi concludo que o arquivo ROAI.owl, que
contm as classes ontolgicas para cada objeto j apresentado na
Figura 3 totalmente reaproveitado, pois as interfaces JSP e XML
dividem o mesmo banco de dados. J dos arquivos apresentados abaixo
na Figura 9, nenhum ser reaproveitado diretamente. O advanced.jsp o
arquivo que foi modificado para apresentar em tela as entradas para
a busca semntica, o results.jsp, o responsvel pela apresentao dos
resultados da busca semntica e por fim, semanticResults.jsp o
responsvel pela comunicao com o HermiT, passando e recebendo as
informaes processadas pelo motor. Este ltimo, ser convertido para
um arquivo do tipo java e ter as mesmas atribuies que tinha na funo
implantada na interface JSP.
Os fontes, tanto java quanto XML podem ser alterados em qualquer
interface, de acordo com a preferncia do programador, neste
projeto, faz-se uso do Geany11.
Figura 9. Arquivos gerados pela implementao de busca semntica na
interface JSP.
A parte de interface da busca semntica, tanto simples quanto
avanada e a apresentao dos dados retornados consistem em um
desenvolvimento totalmente novo. As novas telas principais so
apresentadas nas figuras 10 e 11.
11 Geany trata-se de um editor de texto multiplataforma
desenvolvido em GTK+
-
Figura 10. Nova Tela Pgina Inicial ROAI
Figura 11. Nova Tela Resultados Busca Semntica (Simples)
-
Para efetuar as alteraes apresentadas nas imagens, foram
alterados os arquivos site-map.xml, que possui todas as referencias
dos objetos apresentados nas telas do tema padro da interface XML,
e tambm o arquivo style.css, tambm correspondente ao tema, que
define o estilo e posicionamento dos objetos em tela. Quanto as
alteraes referente a funo de busca semntica, essas sero apenas
liberadas com a automao da modelagem de objetos de aprendizagem
para o padro OWL, cujo modelo adotado, apresentado e justificado no
prximo captulo.
4.2 CONSIDERAES GERAIS
Este captulo apresentou de forma sinttica a justificativa da
nova atividade relacionada ao projeto, para este estgio, referente
a converso do sistema de busca semntica para o padro XML e a forma
como foi realizada a atividade. Para a compreenso do Manakin e com
o intuito de planejar as alteraes para um melhor resultado foram
estudados a fundo o cdigo fonte da ferramenta Dspace verso 1.7.1,
assim como seu manual, contido no site da aplicao (Dspace, 2012).
Tambm foram pesquisados artigos cientficos que mencionam alteraes
no Manakin e realizadas constantes consultas a lista do grupo de
usurios do Dspace, na qual foi possvel se comunicar com
administradores de repositrios Dspace based on, alm de contar com
apoio do prprio suporte do time que construiu e implementou novas
funes e correes na ferramenta.
Embora esteja bem estruturado, o Manakin no entanto no possu uma
documentao adequada no caso de alteraes complexas e de grande porte
a nvel de fonte. Assim, para efetuar as alteraes com assertividade
e qualidade (foco em usabilidade) foi realizado o estudo de fontes
da aplicao, cujo estado atual concludo. Esse estudo possibilitou o
conhecimento e compreenso da estrutura no apenas para as alteraes
de interface, como tambm, para a implementao da modelagem automtica
de objetos de aprendizagem para o padro OWL. Esse processo, no
entanto, documentado no prximo captulo.
-
5. AUTOMATIZAO DA MODELAGEM DE OBJETOS DE APRENDIZAGEM PARA O
PADRO OWL
Esse captulo documenta as atividades j realizadas em relao ao
processo de automatizao da modelagem de objetos de aprendizagem
para o padro OWL. Tambm so listados conceitos especficos dessa
etapa do projeto e justificativas de adoo de tais conceitos
5.1 MODELAGEM ATUAL DE OBJETOS DE APRENDIZAGEM PARA O PADRO
OWL
Atualmente, para que um objeto seja adicionado ou excludo da
ontologia do ROAI necessrio fazer todo o processo manualmente. Para
a ao de adio de novo objeto, observam-se os seguintes passos:
Aps a aprovao da submisso dos objetos por parte dos avaliadores
tcnicos e pedaggicos do ROAI, o administrador do sistema, com
acesso ao servidor onde o repositrio est hospedado mapeia as
informaes dos metadados essenciais e levanta as informaes dos
metadados adicionais da busca semntica. O preenchimento da
propriedade relation da ontologia feito com base nos conhecimentos
e compreenso do administrador sobre o tema ao qual o objeto
pertence.
Com todas as informaes do objeto a mo, o administrador adiciona
as classes OWL apresentadas no Quadro 3 (seo 3.1), referenciando o
objeto recm-adicionado, no arquivo ROAI.owl, contido no servidor da
aplicao. Sendo a manuteno da integridade do arquivo e das classes
OWL dos objetos responsabilidade de cada usurio que o altera.
No processo de excluso h somente um passo: O administrador do
sistema, com acesso ao servidor da aplicao, deve
localizar o arquivo ROAI.owl e eliminar todas as classes OWL que
referenciam o objeto a ser eliminado, sendo responsabilidade desse
administrador manter a integridade do arquivo e das classes dos
outros objetos.
-
Analisando os passos citados acima conclu-se que o processo
atual, alm de ser invivel para grandes quantidades de objetos, por
ser totalmente manual, pode ocasionar danos a integridade do
arquivo e das classes j cadastradas. Soma-se a isso o fato de que a
propriedade relation preenchida com base no conhecimento do
administrador, e que para manter a integridade dessa classe,
necessrio que o administrador tenha a disposio profissionais
(especialistas) referentes as comunidades e colees contidas no
ROAI, para eventuais consultas em caso de dvidas sobre
relacionamento de objetos.
5.2 LEVANTAMENTO DAS PROPRIEDADES ONTOLGICAS
A atividade inicial desse projeto consistiu no levantamento das
propriedades ontolgicas, ou classes, necessrias a cada objetos para
a busca semntica. Ou seja, foi feito um mapeamento cruzado entre as
informaes contidas nos metadados j solicitadas no cadastro dos
objetos de aprendizagem e as necessrias para o preenchimento das
classes do arquivo de ontologia, o resultado apresentado no Quadro
7.
Metadado (Essenciais)
Contido no Cadastro de Objetos?
Observao Representao OWL
Entrada (Entry)
Implicito ID nica do objeto
Ttulo (Title) Sim
Idioma (Language)
Sim
Descrio (Description)
Sim
Criador (Creator)
No
Data (Date) Implicita (TODAY)
Formato (Format)
Implicito
-
Tamanho (Extent)
Implicito
Direitos (Rights)
Sim
Metadado (Adicionados na Busca Semntica)
Contido no Cadastro de Objetos?
Observao Representao OWL
Contribuinte (Contributor)
Sim Autor
Relao (Relation)
No
Parte de (isPartOf)
N/A Informao extrada do relacionamento do objeto com coleo
Tem parte (hasPart)
N/A Informao extrada do relacionamento do objeto com coleo
Quadro 7. Mapeamento Cruzado Cadastro X Classes Ontolgicas
Como resultado, observa-se que trs, das quatro informaes
adicionais podem ter sua origem no prprio cadastro de objeto de
aprendizagem, no entanto, o preenchimento da classe relation de
forma automtica, no se mostrou um processo simples, pois, conforme
relatado na seo 5.1, at ento seu preenchimento, e o mais relevante,
a origem das informaes contidas nessa classe, era um processo
manual, totalmente dependente do fator humano. Assim, buscando
embasamento cientfico para a implementao dessa funo no ROAI, a
prxima seo trata da anlise de trabalhos similares ao proposto por
esse projeto.
-
5.3 TRABALHOS RELACIONADOS
Visando a nova funcionalidade do ROAI (mapeamento automtico dos
OAs na ontologia), figurou entre as atividades desse projeto a
pesquisa por trabalhos similares e relacionados a este. A partir de
um pool de projetos relacionados foi realizada uma analise listando
suas tecnologias, instituies e contribuies que poderiam oferecer a
automatizao da modelagem dos objetos de aprendizagem para o padro
OWL. O Quadro 8 apresenta os projetos julgados relevantes pela
equipe.
Titulo / Descrio
Padro de MD12
Instituio
Engine OL13 Sistema gerenciador repositrio
Gerao ontologia
Contribuio
1.Squirrel - Squirrell Squirrel OWL - Automtica Apresenta uma
proposta hibrida de
busca semntica e por palavra-chave.
2. Integrao de Metadados Dublin Core em Colees de Heranas
Culturais utilizando
Ontologias.
DC14
IMIS15 -
CIDOC
-
- Apresenta um modelo para o mapeamento dos metadados na
forma de uma ontologia.
3.SemanticWeb enabled
digital repositories
IEEE LOM / DC
Patras16 HERMIT /
FACT++ / Pellet
OWL / RDF
DSPACE Automtica Utiliza as mesmas tecnologias j
implementadas no ROAI. Refere-se ao
trabalho que deu inicio a implementao
semntica no ROAI. Introduz o conceito de
OAI, que permite a integrao de
metadados de diversas origens.
12 Metadados
13 Ontology Language
14 Dublin Core
15 Institute for the Management of Information Systems (Athenas,
Grcia)
16 University of Patras (Patras, Grcia)
-
4.Recuperao Semntica
de Objetos de Aprendizage
m: Uma Abordagem Baseada em Tesauros de Propsito Genrico
- UNICSUL17
- OWL / RDF
- - Introduz o conceito de Thesauros, que um tipo de referncia
que
listas palavras agrupadas de acordo
com significado.
5.Associao de Recursos Semnticos
para a Anotao de Objetos de
Aprendizagem
IEEE LOM / DC /
CanCore
PUC Minas Gerais
Prope a construo de um
novo mecanismo de busca
OWL - - Prope um conjunto de metadados que
facilitam o mapeamento
semntico. Esses metadados so
combinados a partir dos padres existentes.
6.GoNTogle
No especficado
IMIS
Lucene / Proteg
RDF / OWL
/ RDFS
No especficado Automtica
Oferece busca semntica simples e avanada, alm da busca por
palavra chave. Tambm oferece busca
combinada com informaes
semnticas e palavras chaves.
7.Extrao de Metadados utilizando
uma ontologia de
domnio
DC UFRGS18 Jena RDF / OWL
/ RDFS
/ DAM
L
- Automtica Define como funciona o processo de populao da
ontologia.
8.Projeto BROAD:
Busca Semntica
por objeto de aprendizagem
DC UFJF19 - XML / RDF
/ SCORM
O projeto trata da construo
de um Framework prprio para
busca em diretrio
distribudos
Automtica Prope um conjunto de metadados com foco
nos metadados educacionais.
Quadro 8. Anlise dos aspectos relevantes dos trabalhos
relacionados com foco em semntica e ontologia.
17 Universidade Cruzeiro do Sul (So Paulo)
18 Universidade Federal do Rio Grande do Sul
19 Universidade Federal de Juiz de Fora
-
Os dados listados no Quadro 8 oferecem uma viso da ampla gama de
possibilidade de aplicaes ao trabalho proposto. Nesta etapa,
procurou-se levantar trabalhos relacionados que apresentam solues
completas ou parciais para os problemas vinculados a gerao
automtica da ontologia. O Quadro 8 apresenta os 5 principais
aspectos analisados que so:
Padro de metadados; Motor de busca (Engine); Linguagem da
ontologia; Sistema gerenciador do repositrio e; Se implementada a
gerao automtica da ontologia.
Estes aspectos so cruciais na identificao da relao entre os
trabalhos descritos no quadro 8 e a atual pesquisa, alm disso,
tambm traz uma anlise da potencial contribuio que cada trabalho
pode oferecer.
A preocupao com a definio do conjunto de metadados que descrevem
os objetos de aprendizagem foi um tema amplamente discutido por
Kemczinski (2010) e Ferlin (2009) em referencia a sua aplicao no
ROAI. Patrocinio (2009) no trabalho relacionado nmero 5 tambm
apresenta uma comparao entre quatro repositrios brasileiros de OAs
e seus metadados, e, soma a ela uma anlise dos padres de metadados
mais utilizados e discutidos a nvel internacional. A partir desta
anlise o autor props um modelo de metadados para anotao semntica de
OAs. Kemczinski (2010), por sua vez, seguindo a mesma abordagem
metodolgica, props os metadados utilizados atualmente pelo ROAI,
baseados no padro Dublin Core, intitulados metadados essenciais.
Observa-se a partir do Quadro 8 que, dentre os oito projetos
listados, cinco fazem uso do Dublin Core, fomentando sua relevncia
entre os diversos modelos de metadados existentes.
Kochhann (2012) ao propor a implementao do sistema de busca
semntica no ROAI com base na aplicao de uma ontologia, trouxe
novamente a discusso o padro de metadados aplicado ao repositrio.
Para a especificao desta ontologia, Kochhann (2012) utilizou como
base a metodologia proposta por (Koutsomitropoulos et al., 2009),
que fez uso dos metadados essenciais mapeados por Ferlin (2009) e
das estruturas dispostas no ROAI (Comunidade e Coleo). Alm desses
elementos, foram adicionados quatro novos metadados, para que fosse
possvel a ontologia, inferir
-
relaes entre esses OAs. Esta ontologia foi denominada de
ontoROAI. Seguindo o padro (W3C, 2012) para desenvolvimento de
tecnologias, a linguagem adotada para a ontologia foi o OWL. Por
ser um padro adotado pelo W3C, observa-se que entre os nove
trabalhos relacionados, seis tambm utilizam o OWL. O RDF tambm um
modelo com uso expressivo por ser uma extenso do XML, conforme
mencionado na seo 3.3 deste trabalho. Em resumo, para a ontoROAI,
os metadados essenciais juntamente com os metadados adicionais
(Kochhann, 2012) mapeiam a instncia do OA. Por se tratar de um
projeto que faz uso de semntica, importante mencionar que, embora a
IEEE (Patrocinio, 2009) tenha definido seu modelo IEEE LOM como o
padro para aplicaes semnticas, o uso do Dublin Core muito difundido
pois a Open Archives Initiave (OAI), que promove integrao entre
diferentes modelos de metadados o usa para tal. E, a interface
promovida a partir da OAI, pode ser utilizada no somente para a
coleta de dados (harvesting), como tambm para a populao de
ontologias, porm, esse tema detalhado nas sees 5.4 e 5.5.
Em relao a reasoner ou motor de inferncia a aplicao semntica
incorporada ao repositrio por (Kochhann, 2012) utiliza o Hermit.
Este motor responsvel por realizar a inferncia no arquivo OWL onde
as classes ontolgicas dos OAs esto armazenadas e retornar os OAs
selecionados de acordo com os critrios de busca. O motor de
inferncia Hermit utilizado na soluo proposta por (Koutsomitropoulos
et al., 2009) trabalho relacionado nmero 3. O motor de inferncia
Jena (OLIVEIRA, 2009) trabalho relacionado nmero 7 apresenta uma
soluo hdrica de busca semntica e por palavra chave e desta forma
considerando os objetivos definidos para este projeto no se mostra
aplicvel atualmente. O mesmo se aplica a soluo que faz uso
combinado do Lucene e Proteg (Giannopoulos, 2010) e aplicada no
GoNTogle trabalho relacionado nmero 6.
O objetivo final reduzir a interao humana na populao da
ontologia ontoROAI, automatizando o processo. Visando oferecer a
melhor soluo possvel ao ROAI, a pesquisa foi fragmentada e
ampliada, buscando no somente por repositrios que faam o uso de
semntica e ontologia, como tambm marcadores semnticos e outras
aplicaes que se disponham ao uso de ontologia. Porm, importante
salientar, que os trabalhos que no apresentam solues automticas no
esto alinhados aos objetivos deste projeto, por isso oferecem pouca
ou nenhuma contribuio. A gerao automtica precisa compreender todas
as fases do processo e a soluo aplicada por
-
(Koutsomitropoulos et al., 2009) se adqua ao objetivo este
trabalho. Dessa forma, esse projeto continua baseado na metodologia
proposta por Kochhann (2012). As prximas sees apresentam conceitos
relacionados ao mtodo de modelagem automtica de objetos para o
padro OWL implementado por Koutsomitropoulos (2009) e tambm sua
adaptao ao ROAI, pois, assim como Kochhann (2012), o autor tambm
tem sua aplicao na interface JSP do Dspace, alm de fazer uso do
IEEE LOM combinado com o Dublin Core (DC).
5.4 OAI-PMH
De acordo com a documentao do Dspace (Duraspace, 2012), no
modelo proposto por Koutsomitropoulos (2009), os dados necessrios a
ontologia so populados automaticamente pela coleta de metadados
atravs da interface OAI-PMH. OAI-PMH, segundo Garcia (2003), um
protocolo da Iniciativa Open Archives (OAI), que proporciona
interoperabilidade entre bibliotecas/repositrios digitais e que
atravs desse protocolo possvel integrar metadados de mais de uma
origem com baixo custo. Os metadados desse protocolo, seguem o
padro Dublin Core, o mesmo utilizado no Dspace, que a ferramenta na
qual o ROAI tem seu embasamento (plataforma). Conforme o IBICT
(2012) o DSpace usa o Protocolo de comunicao da Iniciativa dos
Arquivos Abertos (OAI-PMH) verso 2.0 como provedor de dados. Essa
aplicao foi desenvolvida usando um software livre da OCLC, o OAICat
para conseguir que os itens do DSpace estejam disponveis para serem
coletados (harvested). O DSpace@MIT est registrado como um provedor
de dados na Iniciativa de Arquivos Abertos. As instituies que
decidam implementer o sistema podem escolher ser parte da
Iniciativa ou no e registrar-se como provedores de dados na
Internet (IBICT, 2012).
Todos os fatores listados acima contriburam para a escolha do
modelo de automatizao proposto por Koutsomitropoulos (2009). Porm,
importante salientar que at a implementao desse projeto, a
interface OAI no estava acessvel no ROAI
(http://roai.joinville.udesc.br), sendo sua disponibilizao parte da
nova funo.
O acesso a interface OAI no Dspace um pouco diferente do acesso
a interface XML ou JSP, no qual apenas se informa o endereo do
servidor da aplicao.
-
necessrio que se faa uma requisio de informao, diretamente no
navegador, assim como apresentada na figura 12.
Figura 12. Requisio interface OAI
Para que seja possvel compreender a ao executada na figura 12,
preciso entender o funcionamento do protocolo OAI-PMH. Garcia
(2003), informa que o OAI-PMH consiste de 6 verbos ou requests
(Identify, ListIdentifier, ListMetadataFormats, ListSets,
ListRecord, GetRecord), cada um desses verbos tem uma funo
especfica:
Identify: recupera as informaes sobre o provedor de dados
ListMetadataFormats: recupera os formatos de metadados disponveis
no
repositrio
ListSets: lista a hierarquia do repositrio ListRecord: faz a
coleta de dados do repositrio ListIdentifier: retorna apenas o
cabealho dos registros, pode ser
classificado como uma verso resumida do ListRecord GetRecord:
recupera um nico registro especfico
Outro fator importante sobre o OAI-PMH, que esse protocolo
introduz o conceito de harvesting, que se trata se um processo
unilateral, onde periodicamente so realizadas
-
buscas em repositrios cadastrados na interface OAI, para coleta
de dados que podem ser exibidos ao usurio. Essa coleta de dados
pode ser total ou seletiva de acordo com os dois parmetros
abaixo:
Baseado em data: so coletados apenas metadados inclusos ou
alterados depois da data de corte informada
Baseado em conjuntos: itens so agrupados em uma estrutura
opcional com o intuito de serem resgatados em uma coleta
seletiva
No Dspace, necessrio que a funo Harvesting esteja ativa para que
a coleta de dados acontea. Essa funcionalidade pode ser ativada ou
desativada no painel de controle, por um usurio administrador do
repositrio, conforme figura 13.
Figura 13. Funo Harvesting no Painel de Controle do ROAI
-
O conhecimento conceitual do protocolo OAI-PMH e sua relao
estreita com o Dspace essencial para o entendimento de como
funciona o modelo de populao automtica de ontologia concebido por
Koutsomitropoulos (2009).
5.5 POPULANDO ARQUIVO DE ONTOLOGIA COM A INTERFACE OAI
Para a populao do arquivos de ontologia, Koutsomitropoulos
(2009) aplica, numa viso simplificada, os seguintes passos:
Configura a interface OAI-PMH do Dspace para exportar os
elementos desejados dos metadados (padro Dublin Core);
Um arquivo do tipo XLST responsvel definir as ligaes semnticas,
utilizando o modelo da ontologia, as informaes do novo objeto e dos
objetos j cadastrados e ontologicamente mapeados. As definies so
feitas a parte de comparao entre as classes definidas no
modelo.
Um servlet faz a populao automtica do arquivo de ontologia,
fazendo uso da coleta realizada pela interface OAI, passando esses
dados pelo arquivo XLST e por fim liberando o arquivo de ontologia
resultante para uso das funes semnticas do repositrio;
Nos passos apresentados acima, est implicito o tratamento de
comunicao e converso entre os padres LOM e Dublin Core (DC). Embora
o padro utilizado no repositrio para armazenamento seja o LOM,
Koutsomitropoulos (2009) faz uso do Dublin Core para as funes
semnticas. Isso se deve ao fato de que, embora o LOM seja o grupo
de metadados oficial para uso de semntica, o Dublin Core o padro
utilizado pela proposta de Open Archives Initiave, conforme
explicado na sesso 5.4, e o autor propor o uso da coleta automtica
de metadados (harvesting) para a populao da ontologia. O uso da
interface OAI foi definido com base na premissa definida por
Koutsomitropoulos (2009): Manter intacta a modelagem interna dos
dados do repositrio, empregando seu facilitador de
interperabilidade (OAI-PMH).
-
5.5.1 Transformando a entrada OAI-PMH em Ontologia OWL
O arquivo do tipo XLST, chamado por Koutsomitropoulos (ano) de
transformation, o cerne da populao automtica de ontologia. Com as
entradas recebidas do servlet, o transformation importa um arquivo
de ontologia que contem apenas a modelagem ou esqueleto da
ontologia, ou seja, com base nele que a funo entende qual o modelo
de ontologia a ser seguido. Na aplicao de Koutsomitropoulos, seria
necessrio promover nesse ponto, um mapeamento entre os metadados
LOM e Dublin Core, passo esse que no necessrio na implementao ao
ROAI.
Conforme a seo 3.4, observa-se que a aplicao de busca semntica
do ROAI baseada na proposta de Koutsomitropoulos e no a mesma
soluo, o que evidente, por exemplo, se for comparada a entrada de
busca semntica do ROAI, apresentada anteriormente na figura 11, com
a entrada de busca semntica do repositrio da Universidade de Patras
(entidade da qual o Dr. Dimitrios Koustmitropoulos faz parte e para
qual a soluo semntica foi modelada) demonstrada na figura 14, em
que necessrio sempre fazer o uso da sintaxe Manchester, no formato
de uma query como entrada para a busca.
Figura 14. Repositrio de Objetos Universidade de Patras
-
No caso do ROAI, o usurio informa palavras-chaves e o motor de
inferncia realizada o filtro no arquivo de ontologia, e se
utilizando das relaes semnticas contidas no arquivo para a produo
de resultados consistentes.
A parte final do transformation responsvel pelo filtro de
similaridade semntica, onde so comparadas as propriedades
ontolgicas do novo objeto j convertidas com base no modelo, com os
objetos j mapeados ontologicamente e armazenados no arquivo de
ontologias, nesse ponto, a propriedade relation, que indica forte
relao entre os objetos alimentada. Essa propriedade uma das mais
importantes no modelo de ontologia do ROAI, sua alimentao falha
pode desestruturar completamente a busca semntica, assim, esse
ponto da implementao um dos que devem sofrer mais testes at o fim
do desenvolvimento desse projeto.
A figura 15, apresentada abaixo, traz o cdigo responsvel por
buscar as informaes na interface OAI e envi-las a funo
transformation.
Figura 15. Envio de informaes ao Transformation
-
Por se tratar de uma funcionalidade nativa do Dspace, a busca de
informaes do OAI feita de forma simples, com o uso do verbo
ListRecords, j apresentado na seo 5.4. O outro parmetro,
&metadataPrefix, serve para identificar o formato no qual o
retorno do OAI deve ser feito. Os valores possveis so: qdc que
significa Quality Dublin Core ou Dublin Core Qualificado, ou oai_dc
que identifica que deve ser retornada uma verso simplificada do
Dublin Core. Porm, a verso simplifica no traz todas as informaes
necessrias para o mapeamento e populao do arquivo de ontologias,
assim, para essa implementao feito uso do qdc.
5.6 CONSIDERAES GERAIS
O captulo cinco apresentou, alm dos passos para a implementao da
automao do processo de modelagem automtica para o padro OWL
atualmente em desenvolvimento, os motivos da escolha do modelo
aplicado. A deciso foi modelada a partir do cruzamento dos dados
referentes aos trabalhos relacionados versus os objetivos propostos
por este trabalho. Alm disso, a soluo proposta viabiliza reuso de
fontes da primeira implementao de busca semntica na interface JSP e
da implementao de Koutsomitropoulos, para a parte do servlet
provedor da automatizao e da funo transformation. Embora a
estrutura precise ser convertida afim de ser funcional com a
interface XML, em essncia, grande parte das lgicas sero
reaproveitadas, fazendo assim uso de semi-componentizao. A
componentizao um conceito de engenharia de software cuja premissa o
reuso de componentes e funes para vrias aplicaes e/ou projetos
(Sommerville, 2007). possvel concluir, dessa forma, que, alm de
viabilizar melhorias para o usurio final do ROAI, este projeto
tambm preza pela qualidade da aplicao e organizao, com o intuito de
facilitar as futuras implantaes de funcionalidades no ROAI.
-
CONCLUSO
Embora o projeto inicial tenha recebido outras grandes tarefas
busca semntica na interface XML e tarefas relacionadas e acrescido
muito em nmero de horas, a concluso, at o presente momento, que as
novas metas e atividades adicionadas em meio execuo do projeto,
podem oferecer ao usurio um ambiente com maior usabilidade, a
partir de uma interface mais simples, intuitiva e centralizada, alm
da disponibilidade da funo de busca semntica na interface do ROAI.
Alm disso, o estudo de fontes e estrutura do Manakin gerou uma nova
base de conhecimento que deve ser registrada para ser reaproveitada
em projetos posteriores, e tambm foi essencial para o planejamento
do desenvolvimento da funo de automatizao da modelagem de objetos
de aprendizagem para o padro OWL.
A funo semntica permite aos usurios resultados com maior
qualidade e preciso, auxiliando o processo de ensino-aprendizagem
proposto pelo uso do ROAI. A automatizao do processo de populao de
ontologias tem sua importncia assegurada no quesito integridade dos
dados, pois uma modelagem no consistente pode trazer grandes
impactos ao usurio final, ao qual podem ser entregues informaes
divergentes ou sem utilidade, forando-o ao filtro manual, muito
comum nas buscas por palavras-chaves.
O curso de Tecnologia em Anlise e Desenvolvimento de Sistemas
oferece uma viso mais analtica se comparado ao curso de Bacharelado
em Cincia da Computao, se aborda menos tecnologias e linguagens de
programao, o foco se centra nos pontos de anlise e gerncia dos
projetos. Essas caractersticas foram incorporadas ao projeto, por
exemplo, foi utilizado um mtodo gil para o controle das atividades,
que eram organizadas por perodos semanais e cujas dificuldades e
resultados tambm eram apresentados em reunies semanais. Para o uso
desse mtodo foram utilizados os conceitos abordados nas disciplinas
de Engenharia de Software e Gerncia de Projeto. O processo de
Engenharia Reversa se trata de um conceito tambm abordado em
Engenharia de Software.
Para a modelagem dos requisitos iniciais foram utilizados
conceitos trabalhados em Introduo a Anlise. A tratativa de
dificuldade encontradas no decorrer do projeto foi feita com base
nos conhecimentos adquiridos em Introduo a Anlise, Engenharia
-
de Software, Fundamentos de Sistemas de Informao e Gerncia de
Projetos. O uso da linguagem Java para o desenvolvimento de funes
resgatou o contedo trabalhado em Linguagens de Programao II. E por
fim, com o uso de ferramentas de cdigo aberto, o sistema
operacional do servidor da aplicao Linux, especificamente a
distribuio Ubuntu 9.04 Server, assim foram utilizados a exausto
conceitos de Sistemas Operacionais para que a administrao do
servidor fosse eficaz.
Alm disso, um fator colaborativo para o desenvolvimento desse
projeto, foi o perodo de agosto/2011 julho/2012 do qual eu, Bruna,
fiz parte do Grupo de Pesquisa em Informtica na Educao GPIE como
pesquisadora voluntaria. O projeto trabalhado foi a primeira Busca
Semntica no Repositrio de Objetos de Aprendizagem, no qual a busca
semntica com o uso de ontologia foi estudada e implementada. Entre
as atividades desenvolvidas na poca figuraram:
Domnio de processo de instalao, manuteno e migrao de dados do
ROAI (plataforma Dspace)
Estudo e domnio dos conceitos de web semntica e ontologia Apoio
na modelagem de soluo de busca semntica para o repositrio
Identificao das customizaes j implementadas no ROAI e seu
processo de instalao em novas bases
Criao da base de produo e testes idntica ao ambiente oficial Com
a participao prvia no processo de implementao da busca semntica
mesmo que na interface JSP no foi necessria a adaptao ao uso do
ROAI e novas pesquisas sobre o conceito de busca semntica e
ontologia. Porm, ainda assim, houve duas grandes dificuldades, que
se mostraram praticamente durante o mesmo perodo e foram
responsveis para o inchao do projeto em relao ao nmero de
horas:
ROAI usa por default a interface XML (Ferlin, 2009) e busca
semntica utiliza a interface JSP (Kochhann, 2012);
Volume baixo de projeto relacionados com os objetivos fortemente
alinhados ao ROAI (busca semntica com gerao automtica de ontologia
em repositrios);
Contudo, embora o projeto tenha excedido as 240 horas iniciais e
ainda continue em desenvolvimento, essas dificuldades j se
encontram superadas e colaboraram para engrandecer o conhecimento
da equipe sobre solues de repositrio, busca semntica, ontologias e
desenvolvimento para web.
-
E alm de prover melhorias ao sistema atual, este projeto apontou
caminhos para novas funes e melhorias para o repositrio.
As intenes de projetos futuros atualmente sugerem (para cada
item explicar com mais detalhe:
Descentralizao do arquivo de ontologia: o arquivo de ontologia
atual o mesmo para todo o repositrio, prope-se uma diviso por coleo
e/ou comunidade se embasando no fato de que o arquivo ontolgico
poder ficar com um tamanho grande o suficiente para tornar o
sistema de busca lento de uma forma inaceitvel. Assim, a fragmentao
dessas informaes, em arquivos separados, poderia ser uma soluo a
esse possvel problema;
Marcao semntica de documentos (apenas para arquivos de tipo
texto): ferramentas como o GoNTogle (IMIS, 2012 trabalho
relacionado nmero 6 da seo 5.3) tem produzidos resultados
expressivos em relao a busca por objetos do tipo texto que fazem
uso da marcao semntica. A proposta para o ROAI a marcao semntica
automtica, onde com base nos acessos do usurio precisa ser
cadastrado no ROAI o sistema constri, dinamicamente, marcadores
para que na busca (semntica) os resultados sejam ainda mais
eficazes.
Opo de busca hbrida (palavra-chave com componentes semnticos):
hoje a busca semntica ROAI trata o recebimento de palavras-chave
para a inferncia semntica e faz uso do motor Hermit, a proposta que
seja feita uma integrao que permita a informaes de palavras-chaves
e termos semnticos na mesma busca e que o motor de inferncia por
palavras-chave (Lucene) trabalhe integrado ao motor semntico.
Tratamento de busca avanada (interface similar ao ANEXO A):
oferecer ao usurio com conhecimento ou domnio da sintaxe
Manchester, a possibilidade de modelar manualmente as prprias
queries de busca, porm, a partir de uma interface grfica
Implementao de outros motores de busca (Pellet e FACT ++): o
grupo Semantic Search for Dspace (2012), do qual Koutsomitropoulos
(2009) faz parte, prope o uso tambm dos motores de busca Pellet
e
-
FACT ++ (Duraspace, 2012), permitindo inclusive que o usurio
escolha a engine que deseja utilizar. Assim, proposto que estes
outros dois motores sejam implementados no ROAI e seja analisado se
h vantagens em oferecer os trs motores (Pellet, FACT++ e Hermit),
ou substituir o Hermit por algum deles.
Alm do valor agregado ao uso do ROAI na instituio UDESC
Joinville, este projeto pode vir a contribuir, tambm, para que as
mais de cinqentas instituies brasileiras que fazem uso da
plataforma Dspace (Dspace, 2012), tenham uma opo conterrnea e na
interface XML para a aplicao de busca semntica.
-
ANEXOS
-
ANEXO A:
Fonte: Semantic Search for Dspace
-
GLOSSRIO
Os conceitos bsicos apresentados a seguir esto baseados em
diversas fontes bibliogrficas.
CSS Cascading Style Sheets
FACT++ Fast Classification Terminology ++
GIMP GNU Image Manipulation Program
GPIE Grupo de Pesquisa em Informtica na Educao
GNU GNU is Not Unix
GTK+ GIMP Toolkit
IBICT Instituto Brasileiro de Informao em Cincia e
Tecnologia
IEEE
Institute of Eletric and Eletronic Engineers
JSP JavaServer Pages
LOM Learning Object Metadata
MIT
Massachusetts Institute of Technology
OA Objetos de Aprendizagem
OAI Open Archives Initiative
OAI-PMH Open Archives Initiative Protocol for Metadata
Harvesting
-
OCLC Online Computer Library Center
OWL Ontology Web Language
RDF
Resource Description Framework
ROAI Repositrio de Objetos de Aprendizagem para a rea de
Informtica
UDESC Universidade do Estado de Santa Catarina
URI Uniform Resource Identifiers
URL Uniform Resource Locator
W3C World Wide Web Consortium
XLS XML Spreadsheet
XLST eXtensible Stylesheet Language Transformations
XML
eXtensible Markup Language
-
REFERNCIAS BIBLIOGRFICAS
BERNERS-LEE, T; Semantic Web Road map. A road map for the
future, an architectural plan untested by anything except thought
experiments. W3C, 1998.
BERNERS-LEE, T; HENDLER, J; LASSILA, O. The Semantic Web. A new
form of Web content that is meaningful to computers will unleash a
revolution of new possibilities. Scientific American, Maio
2001.
DSPACE. Sistema Gerenciador de Repositrios Digitais DSpace.
www.dspace.org, (Acesso 5 de outubro de 2012).
DURASPACE. Suporte Dspace. Diponvel em: (acesso em 14 de outubro
de 2012)
FERLIN, J. Repositrio de objetos de aprendizagem para a rea de
informtica. 2009. Universidade do Estado de Santa Catarina UDESC.
Trabalho de concluso de curso.
GARCIA, Patricia de Andrade Bueno ; SUNYE, Marcos Sfair . O
PROTOCOLO OAI-PMH PARA INTEROPERABILIDADE EM BIBLIOTECAS DIGITAIS.
In: I Congresso de Tecnologias para Gesto de Dados e Metadados do
Cone Sul, 2003, PONTA GROSSA. ANAIS DO I CONGRESSO DE TECNOLOGIAS
PARA GESTO DE DADOS E METADADOS DO CONE SUL - CONGED, 2003. v.
1.
GIANNOPOULOS G., BIKAKIS N., DALAMAGAS T., SELLIS T.: "GoNTogle:
A Tool for Semantic Annotation and Search" (Demo). In Proc. of 7th
Extended Semantic Web Conference (ESWC 2010)
-
IBICT. Instituto Brasileiro de Informao em Cincia e Tecnologia.
Disponvel em (Acesso 21 de outubro de 2012).
KEMCZINSKI, A; FERLIN, J; MURAKAMI, E; HOUNSELL, M.
Metadados
Essenciais: Uma Metodologia para Catalogao de Objetos de
Aprendizagem no Repositrio Digital ROAI. WIE XVI Workshop Sobre
Informtica na Escola, 2010.
KOUTSOMITROPOULOS, D; SOLOMOU, G; ALEXOPOULOS, A;
PAPATHEODOROU, T. Semantic Web Enabled Digital Repositories.
Int. Journal on Digital Libraries, 10 (4): 179-199. Springer,
2010.
KOUTSOMITROPOULOS, D; SOLOMOU, G; ALEXOPOULOS, A;
PAPATHEODOROU, T. Semantic Metadata Interoperability and
Inference-Based Querying in Digital Repositories. Journal of
Information Technology Research, 2 (4): 36-52, 2009.
KOUTSOMITROPOULOS, D; SOLOMOU, G; PAPATHEODOROU, T. Metadata
and Semantics in Digital Object Collections: A Case-Study on
CIDOC-CRM and Dublin Core and a Prototype Implementation. Journal
of Digital Information, 10 (6), 2009.
KOUTSOMITROPOULOS, D; SOLOMOU, G; ALEXOPOULOS, A; PAPATHEODOROU,
T. Semantic Metadata Interoperability and Inference-Based Querying
in Digital Repositories. Journal of Information Technology
Research, 2 (4): 36-52, 2009.
KOUTSOMITROPOULOS, D; SOLOMOU, G; PAPATHEODOROU, T. Innovations
in
Information Technology, IIT 2008, International Conference, p.
233-237, 2008.
PROTEG SOFTWARE. Disponvel em (Acesso em 7 de outubro de
2012).
-
KOCHHANN, Fbio Haertel; KEMCZINSKI, Avanilde. Busca semntica no
repositrio de objetos de aprendizagem. 2012. 104 f. : TCC (graduao)
- Universidade do Estado de Santa Catarina, Curso de Cincia da
Computao, Joinville, 2012 .
Semantic Search for Dspace. Disponvel em: . Acesso em 30 de
outubro de 2012.
SOMMERVILLE, Ian. Engenharia de software, 8 edio. Traduo: Selma
Shin ShimizuMelnikoff, Reginaldo Arakaki, Edilson de Andrade
Barbosa. Reviso tcnica: KechiKirama. So Paulo, Pearson
Addison-Wesley, 2007.
UDESC Joinville. Disponvel em (Acesso 5 de outubro de 2012)
UDESC Joinville. Disponvel em (Acesso 7 de outubro de 2012)
W3C. World Wide Web Consortium. Disponvel em . (Acesso 7 de
outubro de 2012).
WOLL, Filipe Ventura; KEMCZINSKI, Avanilde. Processo para
avaliao de objetos de aprendizagem no roai utilizando Workflow.
2011. 98 f. : TCC (graduao) - Universidade do Estado de Santa
Catarina, Curso de Cincia da Computao, Joinville, 2011.