Dr. Hugo Banda Gamboa ([email protected]) Ing Edison Naranjo Díaz ([email protected]) Ing. Juan Pablo Tandazo ([email protected]) Departamento de Informática y Ciencias de Computación ESCUELA POLITÉCNICA NACIONAL 4tas Jornadas de Ingeniería de Sistemas Informáticos y de Computación 12, 13 y 14 de Noviembre Quito- Ecuador
53
Embed
Desarrollo de un agente buscador inteligente de metadatos
Descripción de un agente buscador inteligente para metadatos geográficos
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
La onda semántica es una de las cuatro etapas de crecimiento del Internet: Web 1.0.- Conexión de información y acceso al
Internet.
Web 2.0.- Conexión de personas a redes de participación social.
Web 3.0.- Representación de significado, conexión de conocimiento e integración de estos en diversas tareas de tal forma que las experiencias del uso del Internet sean más relevantes, útiles y satisfactorias.
Web 4.0.- Conexión de inteligencias en una Web ubicua en la que cosas y personas razonan y se comunican.
Beneficios de la Web Semántica Facilitar a las máquinas
la comprensión de lo que se quiere representar.
Permitir a los usuarios delegar tareas en software. El software será capaz de procesar su contenido, razonar con este, combinarlo y realizar deducciones lógicas para resolver problemas cotidianos automáticamente.
Permitir una conexión entre los recursos de la Web. Extender los hiperenlaces a relaciones semánticas.
Generar conocimiento de forma automática ya que los computadores podrán entender los datos que están leyendo.
Impactar en los sistemas de educación en la Web (e-learning).
Lenguajes de marcado.- Lenguajes apropiados para representar, el contenido semántico y los conocimientos que contienen las ontologías (XML, XML Schema).
Metadatos.- Recursos que proveen información acerca de sí mismos, en formato común y procesable por las máquinas: Resource Description Framework (RDF), Resource Description Framework Schema (RDF Schema).
Ontologías.- Utilizadas para representar el conocimiento: Ontology Inference Layer (OIL), Darpa Agent Markup Language (DAML), DAML+OIL, Web Ontology Language (OWL).
Agentes y aplicaciones Web.- Software que funciona dentro del ambiente de Web Semántica.
Ontología Define o especifica una conceptualización de un
dominio específico del conocimiento de manera formal, en términos de conceptos, propiedades, y relaciones en forma explicita. Los conceptos nos dan las ideas de los modelos de
entidades del dominio.
Las propiedades describen características y atributos de los conceptos; y,
Las relaciones nos permiten ver como interactúan los conceptos
Las ontologías codifican el conocimiento en un dominio y también conocimiento que abarca varios los dominios. De esta manera, hacen ese conocimiento re-usable.
Reutilización y Fusión de Ontologías Los sistemas de bibliotecas de ontologías
(Ontology Library Systems) y los entornos ontológicos ayudan a crear nuevas ontologías y reutilizar las existentes. Ejemplos de sistemas de bibliotecas de ontologías:
WebOnto, Ontolingua, DAML ontology library system, SHOE, Ontology Server, IEEE Standard Upper Ontology, Sesame, OntoServer, u ONIONS.
Mas de 200 ontologías DAML pueden ser convertidas a OWL usando OwlConverter, la mayoría se las cuales están en OWL Full.
UMBC: ontologías.
Como ejemplos de entornos ontológicos están: Chimaera o PROMPT.
Metadatos Geográficos Los metadatos consisten de información que
caracteriza otros datos. Están altamente estructurados y son usados para proveer documentación para productos de datos.
Los metadatos responden a preguntas como: ¿quien?, ¿qué?, ¿cuando?, ¿donde?, ¿por qué?, y ¿como?, acerca de cada aspecto del dato que está siendo documentado.
El estándar de metadatos utilizado fue el Content Standard for Digital Geospatial Metadata (CSDGM) del Federal Geographic Data Committee (FGDC) (FGDC-STD-001-1998). Este estándar está diseñado para describir todos los datos geoespaciales posibles.
El Problema La UNISIG dispone de datos digitales y no
digitales de tipo geográfico como mapas, imágenes, archivos de texto, fotografías, etc. que no se encuentran debidamente organizados, publicados, ni existen medios de búsqueda adecuados para acceder con facilidad y de una manera precisa a todos esos recursos de información que se posee.
La Solución Realizar un sistema para acceder a los metadatos
geográficos de la UNISIG mediante la utilización del Content Standard for Digital Geospatial Metadata (CSDGM), ver 2 del Federal Geographic Data Committee (FGDC-STD-001-1998).
Implementación de un agente buscador inteligente de metadatos geográficos, para aplicarlo al manejo de la información que posee la UNISIG, como caso de estudio.
Alcance de la Solución La aplicación consiste en un multiagente
inteligente de búsqueda de metadatos geográficos, que mediante la estructura de Web Semántica, es capaz de buscar metadatos sobre los documentos que posee la UNISIG.
El sistema brinda opciones de consulta tanto local como remota, permitiendo a sus usuarios desplegar y visualizar todos los datos descriptivos de los recursos que pose la UNISIG: imágenes, videos, proyectos y documentos.
Agentes Inteligentes de Búsqueda Son agentes inteligentes software
dedicados a las tareas de localización, acceso y procesamiento de información textual.
Un agente de búsqueda debe tener mínimo las siguientes características de los agentes inteligentes de software: reactividad, proactividad, sociabilidad y autonomía.
ABI-METAGIS ABI-METAGIS fue implementado en la plataforma
JAVA con el estándar J2SE 6.0 y con Servlet 2.3.
Todas las herramientas utilizadas para su construcción son de software libre tal como ECLIPSE, JENA 2.5, JADE 3.5, Protègè 3.3, AgentOWL 1.0.
Las dependencias de software que necesita ABI-METAGIS para su funcionamiento son también de software libre, y están probadas para ejecutarse en los sistemas operativos Windows, Linux y Mac.
ABI-METAGIS brinda la libertad de poder escoger el sistema operativo. Para las pruebas del sistema se lo instaló sobre Windows XP profesional.
Tomcat 5.5.- Realiza la tarea de servidor de aplicaciones Web y servidor Web. Se lo debe configurar en un puerto distinto al que trae por defecto que es el 8080 del protocolo http. Esto es debido a que el servidor eXist funciona en el puerto 8080 del protocolo http.
JADE 3.5
Servidor XML-RPC.- Este servidor es configurado automáticamente en el momento que ABI-METAGIS entra a funcionar y utiliza el puerto 8000 del protocolo http.
JENA 2.5. Framework que ayuda a ABI-METAGIS a realizar la parte de razonamiento e inferencia y a navegar sobre los modelos y bases de conocimiento.
Protègè 3.3. Aparte de ser un editor de ontologías, también ofrece un framework para el manejo de bases de conocimiento.
Dependencias de HW ABI-METAGIS necesita funcionar en un servidor
de buenas características, debido al alto consumo de recursos que requieren las dependencias de software. Si el servidor presenta características menores a las indicadas, el tiempo de respuesta de la aplicación se vera afectado enormemente. A continuación se lista las características básicas con las que debe cumplir el servidor: Procesador: Similar o superior a un Intel Pentium
Dependencias de Red Se necesita de una estructura básica de red donde
pueda funcionar un aplicativo Web.
También se necesita de un dominio de red.
ABI-METAGIS presenta debilidades en cuanto a la seguridad ya que fue concebido para funcionar en una intranet.
La plataforma JADE también presenta debilidades de seguridad, por esta razón queda a criterio de quien lo use, montar o no una infraestructura de seguridades de red.
Ejemplo de Búsqueda … Una vez obtenidos los resultados se navega dentro de estos
y si interesa alguno de estos resultados se da un clic para ver el metadato completo el cual a su vez tiene links a cada una de sus principales secciones.
Ejemplo de Búsqueda … Se escoge cualquiera de las secciones para observar sus
datos. En la sección de Identification Information algunos de los metadatos tienen un enlace al recurso. El link que permite el acceso se encuentra en la etiqueta Online linkage.
Conclusiones El funcionamiento de Agentes de Software en la Web
Semántica es factible con las tecnologías actuales pero del lado del servidor. Se necesita continuar con la investigación de los agentes del lado del cliente, con lo que se podrá conseguir mejores resultados en los objetivos que persigue la Web Semántica.
Se ha logrado en este caso hacer que ciertos agentes “comprendan” la información que transfieren entre ellos, esto gracias a la creación del modelo de conocimiento para búsquedas y del estándar CSDGM-FGDC.
No se puede explotar el potencial de los agentes mientras el usuario realice sentencias de búsquedas carentes de sintaxis o con GUIs de búsqueda avanzada nada flexibles en las cuales no se pueda formular consultas libres.
Recomendaciones Para el manejo de la base de conocimientos persistente se usa
el framework Protègè pero se necesita convertirlo a modelo JENA cada vez que se necesita el mecanismo de razonamiento. La nueva versión de JENA puede soportar por si sola todo el trabajo de gestión de la base de conocimiento persistente, pudiendo así mejorar el rendimiento de la aplicación, por lo cual se recomienda migrar la gestión de la base de conocimiento completamente hacia JENA y utilizar un motor de base de datos ontológico como puede ser Instance Store, Sesame, GO-MySQL u otros.
ABI-METAGIS para atender las solicitudes de búsqueda de los usuarios tiene implementado un banco de agentes interpretes, con lo cual un agente interprete se dedica a atender únicamente a un usuario a la vez. El problema de tiempo de respuesta se presenta cuando el número de usuarios aumenta, por lo que se recomienda revisar futuras versiones de la plataforma JADE, en la que se pueda crear y eliminar agentes automáticamente de una manera óptima y eficaz.
Recomendaciones Para hacer más amigable a ABI-METGIS, se
recomienda la creación de un agente que asista al usuario en la creación de sentencias de búsqueda más complejas, sentencias con sintaxis y semántica, enmarcadas en un dominio de conocimiento común entre usuario-máquina como sería el estándar CSDGM-FGDC.
Para la comunicación entre el servidor de aplicaciones Web y la plataforma de agentes JADE se implementó un puente de comunicación mediante la utilización del servidor XML-RPC. JADE a partir de la versión 3.5 da soporte a la comunicación con aplicativos Web la cual la ha denominado WSIG (Web Services Integration Gateway). Se recomienda para futuras versiones de ABI-METAGIS considerar a WSIG.
Referencias [1] Berners-Lee T. Overview of the future of the web, 1998.
http://www.w3.org/DesignIssues/Semantic.html. [2] Racines R, Chiriboga P. Agente inteligente de recomendación de
productos o servicios basados en ontologías. Proyecto de Titulación ISIC, Facultad de Sistemas, EPN, 2006.
[3] Wache H, Ogele V, VisserT, Stuckenschmidt U, Schuster H, Neumann G, Ubner H. Ontology-based integration of information-a survey of existing approaches. IJCAI-01 Workshop: Ontologies and Information Sharing, Seattle, USA, Aug 2001.
[4] Panchi D. Desarrollo de un sistema de información georeferenciada para el Instituto Geofísico de la Escuela Politécnica Nacional. Proyecto de Titulación ISIC, Facultad de Sistemas, EPN, 2005.
[5] Nikraz M, Caire G, Bahri P A. A Methodology for the Analysis and Design of Multi-Agent Systems using JADE. School of Engineering Science and Parker Center, Murdoch University, Dixon Road, Rockingham, Western Australia 6168 - Telecom Italia Lab, Via Reiss Romoli, Turin, Italy 10148.