Top Banner
Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO
30

Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Apr 07, 2016

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Casamento de EsquemasIAGO RAPHAEL VASCONCELOS MARINHO

Page 2: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Roteiro Motivação

Objetivos

Conceitos fundamentais

Técnicas

Ferramentas atuais

Desafios

Page 3: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Motivação Aplicações

◦ Aplicações web: alinhar catálogos de produtos.◦ Web semântica: alinhar ontologias◦ Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de

outro.◦ Ex.: Mapeamento objeto-relcional

◦ Aplicações médicas

Page 4: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Motivação Aplicações

◦ Aplicações web: alinhar catálogos de produtos.◦ Web semântica: alinhar ontologias◦ Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de

outro.◦ Ex.: Mapeamento objeto-relcional

◦ Aplicações médicas

Operação complexa!

Page 5: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Motivação Aplicações

◦ Aplicações web: alinhar catálogos de produtos.◦ Web semântica: alinhar ontologias◦ Bancos de dados: primeiro passo no processo de mapear instâncias de um esquema para instâncias de

outro.◦ Ex.: Mapeamento objeto-relcional

◦ Aplicações médicas

Operação complexa!

Por envolver diversos modelos de dados e domínios de aplicação, o problema deve ser estudado de forma genérica.

Page 6: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

ObjetivosIntroduzir o problema

de casamento de esquemas;apresentar as abordagens

e ferramentas para resolvê-lo.

Page 7: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Conceitos fundamentais Esquema

◦ Descrição em linguagem formal◦ Conjunto de elementos que se relacionam◦ Ex.: SQL Schema, XML Schema, descrição de ontologia

Operação de “casamento” (matching):◦ Toma dois esquemas como entrada e devolve um mapeamento (correspondências entre os elementos).◦ Mapeamento é expresso em sintaxe específica◦ Problema: encontrar correspondências entre elementos de dois esquemas!

Page 8: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasTaxonomia

Page 9: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasAbordagens iniciais…

◦ Casamento linguístico (Linguistic matching)◦ Algoritmos de processamento e casamento entre strings◦ Substrings, tokenização, stemização

Page 10: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasAbordagens iniciais…

◦ Casamento linguístico (Linguistic matching)◦ Algoritmos de processamento e casamento entre strings◦ Substrings, tokenização, stemização

◦ Uso de informações adicionais!◦ Dicionários, tesauros (dicionário de ideias afins)

Page 11: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasAbordagens iniciais…

◦ Casamento baseado em estrutura◦ Grupos de elementos com estrutura semelhante◦ Relacionamentos semelhantes

Page 12: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasAbordagens iniciais…

◦ Casamento baseado em estrutura◦ Grupos de elementos com estrutura semelhante◦ Relacionamentos semelhantes

◦ Casamento baseado em restrições◦ Ex.: Correspondência UF/Estado: restritos a {AC, AL, …., TO}

Page 13: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasAbordagens iniciais…

◦ Casamento baseado em instâncias

Page 14: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasAbordagens iniciais…

◦ Casamento baseado em instâncias

◦ Casamento baseado em regras◦ Lógica de primeira ordem

Page 15: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasNovos tipos de informação…

Page 16: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

Page 17: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.

Page 18: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.

◦ Top-k matching: “melhores matches” são apresentados ao usuário.

Page 19: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasNovos tipos de informação…

◦ Baseado no uso: interpretação de logs de consulta a bancos de dados, para detectar como os usuários relacionam os esquemas.

◦ Interface gráfica: permite ao usuário navegar pelas correspondências, visualizá-las e corrigi-las.

◦ Top-k matching: “melhores matches” são apresentados ao usuário.

◦ Matching incremental: usuário seleciona um elemento do esquema e algoritmo devolve melhor correspondência (ou melhores, como no top-k).

Page 20: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasCasamento de esquemas de grande porte?...

Page 21: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasCasamento de esquemas de grande porte…

◦ Matching em paralelo

◦ Baseado em partições

◦ Redução do espaço de busca

◦ Otimizações diversas: matrizes de similaridade, otimizações no casamento de strings

Page 22: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

TécnicasCorrespondências com tags…

◦ Tagging semântico◦ Correspondências são marcadas quanto ao seu sentido◦ Ex.: igualdade

◦ Tagging condicional◦ Correspondências válidas apenas quando um elemento assume certo valor◦ Ex.: “code” equivale a “ISRC” somente para “music”

Page 23: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Ferramentas atuais Comparação (2011)

Page 24: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Ferramentas atuais COMA

Page 25: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Ferramentas atuais Harmony

Page 26: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Ferramentas atuais Agreement-maker

Page 27: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Ferramentas atuais Benchmarking: XBenchMatch

Page 28: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Ferramentas atuais Benchmarking: XBenchMatch

Page 29: Casamento de Esquemas IAGO RAPHAEL VASCONCELOS MARINHO.

Desafios Facilitar o reuso de mapeamentos

Melhoria da visualização gráfica dos mapeamentos