ALINEACIÓN DE ONTOLOGÍAS
ALINEACIÓN DE ONTOLOGÍAS
ONTOLOGÍA
Thomas Gruber (Gruber, 1993) define a las ontologías, como “una especificación explicita de una conceptualización”. Una conceptualización es una abstracción, una vista simplificada del mundo que deseamos representar para un cierto propósito
Borst (W.N. Borst, 1997) establece que las ontologías son definidas como “una especificación formal de una conceptualización compartida”.
ONTOLOGÍA
ontologías ligeras: que incluyen conceptos, taxonomía de conceptos, relaciones entre conceptos y propiedades.
ontologías pesadas: agregan axiomas y restricciones a las ontologías ligeras
DIFICULTADES EN CORRESPONDENCIA DE
ONTOLOGÍAS
Heterogeneidad sintáctica: Diferencias en el lenguaje usado para la representación de modelos.
Heterogeneidad estructural: Diferencias en los tipos, y estructura de los elementos.
Heterogeneidad semántica: Donde las mismas entidades del mundo real son representadas usando diferentes términos o viceversa.
Heterogeneidad en modelos: diferencias en los modelos subyacentes (bases de datos, ontologías) o su representación (modelo relacional, orientado a objetos, lenguajes de ontologías RDF, OWL).
ALINEACIÓN DE ONTOLOGÍAS
La interoperabilidad semántica puede ser tratada con una reconciliación ontológica, encontrando relaciones entre entidades que pertenecen a diferentes ontologías, a este proceso se le conoce como alineación de ontologías
ALINEACIÓN DE ONTOLOGÍAS
Diversas estrategias de alineación han sido propuestas, estas técnicas se clasifican por medio de las características de las ontologías (etiquetas, estructuras, instancias, semántica), y usan diversas disciplinas como la estadística, aprendizaje automático o análisis de datos.
También se pueden clasificar a nivel de elemento y a nivel de estructura
ALINEACIÓN DE ONTOLOGÍAS
Nivel de elemento: técnicas basadas en cadenas, lenguaje, consideraciones lingüísticas, restricciones o re-usó de alineaciones. Estas consideran las etiquetas de los conceptos, sus definiciones, el lenguaje en el que las ontologías son expresadas, y cualquier posibilidad para reutilizar previos mapeos para derivar nuevos.
Nivel de estructura: técnicas basadas en grafos, taxonomías, u otros modelos. Estas consideran la ubicación del concepto en la estructura de la ontología, y cómo las correspondencias entre los conceptos pueden contribuir a establecer otras correspondencias.
FALCON-AO (JIAN, ET AL., 2005)
Falcon-AO es una herramienta para alineación de ontologías que consiste en la integración de dos matchers
LMO: basado en similitud lingüística (linguistic matching),
GMO: matcher basado en similitud de grafos (graph matching)
FALCON-AO (JIAN, ET AL., 2005)
En esta aplicación el matcher GMO toma como entrada alineaciones previas provenientes del matcher LMO y utiliza otras alineaciones de entrada provenientes del lenguaje de diseño de las ontologías
Falcon mide y valida la confiabilidad de sus resultados al analizar la comparabilidad estructural y lingüística de las dos ontologías que están siendo comparadas.
FALCON-AO
LMO (LINGUISTIC MATCHING ONTOLOGY)
Para obtener la similitud lingüística, LMO combina el enfoque basado en comparación léxica y un enfoque basado en análisis estadístico.
Para la similitud lingüística nombrada SS, se utilizó la Distancia de Levenshtein entre nombres de entidades y una función para capturar la similitud entre cadenas largas.
Para el análisis estadístico se usó el modelo espacio vectorial (Vector Space Model). Este método se usa para ponderar cada entidad (clases, propiedades, e instancias) de una ontología respecto al resto de los elementos de sí misma, para después realizar la comparación con otra ontología.
LMO (LINGUISTIC MATCHING ONTOLOGY)
Una vez ponderada cada entidad, se construye una colección de documentos y sus vectores por cada ontología, finalmente se calcula la similitud (nombrada DS) entre documentos por medio del producto escalar entre vectores.
Cabe destacar, que previo a la extracción de las entidades de los vectores, se ejecuta un proceso de preparación, que consiste en: separación de palabras, stemming (reducir una palabra a su raíz) y eliminación de “stop words” (preposiciones).
Finalmente los dos métodos para medir similitud lingüística son combinados linealmente, donde los coeficientes son experimentales y se le ha otorgado mayor peso a los resultados a la similitud DS:
Similitud_linguistica = 0.8 DS + 0.2 SS
GMO (GRAPH MATCHING ONTOLOGY)
La idea principal es medir la similitud entre dos entidades (de dos ontologías), considerando la acumulación de similitudes de sentencias involucradas (tripletas)
GMO también toma en cuenta la acumulación de las similitudes de entidades vecinas respecto a las dos entidades que están siendo comparadas.
GMO, acepta un conjunto de pares de entidades relacionadas, que son encontradas previamente por otros algoritmos de similitud (matching).
A la salida GMO proporciona parejas de entidades adicionales al comparar la similitud estructural.
GMO (GRAPH MATCHING ONTOLOGY)
Un enfoque para evaluar los resultados proporcionados por GMO es la comparabilidad lingüística y estructural.
El enfoque de evaluación está basado en dos medidas:
comparabilidad lingüística (LC): mide por medio del número de elementos de pares de entidades que hayan rebasado un umbral de similitud y del total de entidades en cada ontología
comparabilidad estructural (SC): es determinada a través de las ocurrencias de las propiedades incorporadas usadas en las dos ontologías a ser alineadas.
Finalmente un modelo vectorial define esta comparabilidad con la frecuencia de propiedades usadas en ambas ontologías, y el número de ocurrencias
FALCON-AO
Falcon-AO se desempeña bien cuando las estructuras de las ontologías son muy similares entre sí o existe mucha similitud léxica entre las mismas.
También este sistema proporciona buenos resultados cuando las dos ontologías tienen poca similitud léxica pero alta similitud estructural.
Si existe poco vocabulario comun y poca similitud estructural, Falcon dificilmente da buenos resultado.
Hace uso de diccionarios lexicos para la alineacion.
No tiene en cuenta axiomas o reglas logicas.
AGREEMENTMAKER (SUNNA, ET AL., 2007)
Esta arquitectura propone métodos automáticos que transforman en una estructura de grafos la jerarquía de conceptos de una ontología.
maneja un enfoque multicapa, que consiste de 4 capas:
dos usan métodos automáticos,
una usa un método semiautomático,
y la otra es un método manual
AGREEMENTMAKER
Primera capa: proceso de mapeo automático, compara el significado de cada concepto en la primera ontología con cada concepto de la segunda ontología
segunda capa: es un proceso manual de mapeo conducido por un experto de dominio.
Tercera capa: se ejecuta un proceso de mapeo semiautomático por contexto, en el cual los mapeos son deducidos al considerar mapeos establecidos previamente, trabajando desde las hojas del árbol ontológico
cuarta capa: proceso automático de consolidación de mapeos, en el cual son resueltos los posibles conflictos semánticos de las capas anteriores, en esta capa el experto del dominio determina la importancia de las capas al asignar un nivel de prioridad a cada una.
AGREEMENTMAKER
El enfoque semiautomático que se propone en AgreementMaker, involucra la intervención del usuario experto durante el proceso de alineación, lo cual contribuye en precisión al detectar las correspondencias semánticas.
RIMON (LI, ET AL., 2008)
Aquí las estrategias usadas consisten en técnicas basadas en lingüística:
Distancia de Levenshtein y statistical learning
También técnicas basadas en estructuras:
propagación de similitud, propagación de propiedad a propiedad y propagación de concepto a propiedad
RIMON
Inicialmente se examina la estructura de las ontologías y la similitud léxica entre conceptos, para determinar qué estrategias se utilizan en el proceso de alineación.
Si existe una alta similitud léxica entre los nombres, el sistema usará técnicas basadas en lingüística para encontrar las correspondencias entre conceptos
Luego se aplican las estrategias de alineación seleccionadas por un experto
SIMILARITY FLOODING (MELNIK, ET AL., 2001)
Técnica basada en modelos estructurales, este algoritmo es usado para establecer correspondencias en varios modelos o estructuras de datos
recibe dos modelos de datos que después serán convertidos a grafos.
“si dos grafos son similares entonces, también sus conceptos adyacentes en cierto grado también
son similares”.
OLA ALINEACIÓN DE ONTOLOGÍAS (EUZENAT, ET
AL., 2004B)
OLA transforma las ontologías OWL en estructuras basadas en grafos encontrando todas las relaciones entre entidades (e.g., clase, propiedad) y considera todas las características de las entidades (e.g., superclases, propiedades).
Estos grafos establecen las restricciones para calcular la similitud entre entidades de ontologías usando diversas medidas de similitud ponderadas, las cuales son combinadas de forma lineal.
Se consideran conjuntos de relaciones entre parejas de entidades, que dependen de correspondencias locales (entidad-relación-entidad).
CONTINUARA…
GRACIAS