Feb-26-03 Cesena Introduzione all’ontology engineering Ernesto Damiani Dipartimento di Tecnologie dell’Informazione – Università di Milano Polo di Crema Feb-26-03 Cesena Sommario z Cos’è il Web of Knowledge ? z I metadati z I formati storici z Nuovi formati: da XML a RDF z RDF Schema e il Semantic Web z Ontology Engineering Feb-26-03 Cesena Web of Knowledge z L’educazione moderna incoraggia la specializzazione. Lo storico e il fisico “generico” sono stati sostituiti da figure con competenze più focalizzate (e.g. lo storico del Rinascimento o l’astrofisico) z Però: il progresso della conoscenza nasce dalle interconnessioni “laterali” tra discipline quanto e più che dalla ricerca “verticale”. z Conoscenza=informazione organizzata Feb-26-03 Cesena Un esempio: Frankenstein search (James Burke) Feb-26-03 Cesena Frankenstein search: struttura d’accesso Feb-26-03 Cesena Frankenstein search: i dati
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Feb-26-03 Cesena
Introduzione all’ontologyengineering
Ernesto DamianiDipartimento diTecnologiedell’Informazione –Università di MilanoPolo di Crema
Feb-26-03 Cesena
Sommario
z Cos’è il Web of Knowledge ?z I metadatiz I formati storiciz Nuovi formati: da XML a RDFz RDF Schema e il Semantic Webz Ontology Engineering
Feb-26-03 Cesena
Web of Knowledge
z L’educazione moderna incoraggia laspecializzazione. Lo storico e il fisico “generico”sono stati sostituiti da figure con competenzepiù focalizzate (e.g. lo storico del Rinascimentoo l’astrofisico)
z Però: il progresso della conoscenza nasce dalleinterconnessioni “laterali” tra discipline quanto epiù che dalla ricerca “verticale”.
z Conoscenza=informazione organizzata
Feb-26-03 Cesena
Un esempio:
Frankenstein search(James Burke)
Feb-26-03 Cesena
Frankenstein search:
struttura d’accesso
Feb-26-03 Cesena
Frankenstein search: i dati
Feb-26-03 Cesena
Frankenstein search: i metadati
vincoli
tipi
relazioni
Feb-26-03 Cesena
Metadati: una visione‘ingenua’
z Dati che descrivono altri datiy e.g. il catalogo di una biblioteca
z Spesso piu’ facili da trattare deidati stessiy Il formato dei metadati è una decisione
del catalogatore, quello dei dati no..
Feb-26-03 Cesena
Quindi:
z Metadati =‘etichettedescrittive’esprimono:y Struttura e semantica dei
datima anche altro:y Autorey Copyrighty Informazioni di
autenticazioney Protezioni e permessi
d’accessoy Prezzo
z Usi dei metadatiy Catalogazione dei datiy Elaborazione automatica
dei dati da parte di agentisoftware
y Controllo degli accessiy Filtraggio dei flussi
informativi
Feb-26-03 Cesena
Il “meaning triangle” (Ogden andRichards, 1923)
Metadati: una visione “colta”
Feb-26-03 Cesena
Esempi ‘storici’
z PICSz Dublin core
Feb-26-03 Cesena
PICS
z Platform for Internet Content Selectionz www.w3.org/PICS/z Recommendation dal 1996z Condivisione e interscambio di valutazioni
su siti e pagine Weby etichette PICS trasportate negli header HTTP
or come marcatori METAx from document serverx or an independent label bureau
y firmati elettronicamente e associati con undigest
Feb-26-03 Cesena
<html> <head> <META http-equiv="PICS-Label" content=' (PICS-1.1 "http://www.gcf.org/v2.5" labels on "1999.11.05T08:15-0500" until ”2001.12.31T23:59-0000" for "http://w3.org/PICS/Overview.html" ratings (suds 0.5 density 0 color/hue 1))'> </head> <body> <p>qui va il documento</p> </body></html>
Esempio
Feb-26-03 Cesena
Applicazioni di PICS
z Protezione dei minoriy CyberPatrol, EvalWeb, NetNanny, …
z Utente genera o ottiene un profiloz L’applicazione confronta rating e profilo e
compie una delle seguenti azioni:y suggesty searchy monitory warny block
Feb-26-03 Cesena
Etichette Recreational SoftwareAdvisory Council (RSAC): Violenza
z (category (transmit-as "v") (name "Violence")(label (name "Conflict") (description "Harmlessconflict; some damage to objects") (value 0))(label (name "Fighting") (description "Creaturesinjured or killed; damage to objects; fighting")(value 1)) (label (name "Killing") (description"Humans injured or killed with small amount ofblood") (value 2)) (label (name "Blood andGore") (description "Humans injured or killed;blood and gore") (value 3)) (label (name"Wanton Violence") (description "Wanton andgratuitous violence; torture; rape") (value 4)))
Feb-26-03 Cesena
Problemi
z Chi sceglie le etichette?z Chi ne definisce la sintassi?z Come determinarne il significato?z A quale dato sono associate?
Feb-26-03 Cesena
Dublin Core
z 15 etichettez Metadati bibliograficiz Campi tipati
y vocabolario controllatoy ISO 8601 (date)y tipi di risorsey URLs, ISBNsy RC 1766 (lingue)
Feb-26-03 Cesena
Elementi Dublin Core (1)
z Titlez Creator (persona,
organizzazione,servizio)
z Subject (lista diparole chiave dalvocabolariocontrollato)
z XML Schema (perchè no?..)z RDF (Resource Description
Framework)z RDF Schema
Feb-26-03 Cesena
Uso di schemi XML come
rappresentazione di metadati
• Problemaprincipale: ilpotereespressivo
•Ambiguità nelsignificatodell’inclusionedi elementi
Feb-26-03 Cesena
RDF
z Resource Description Frameworkz W3C Recommendation, dal Febbraio 1999
y si basa su XML e spazi di denominazione
z Indipendente dalla piattaformaz Eredita’
y PICSy biblioteche digitali, SGML e rappresentazione
della conoscenza
z Scopo principaley rendere le etichette elaborabili da agenti
software oltre che leggibili dall’uomo
Feb-26-03 Cesena
Primi passi con RDF
z I dati sono descritti da asserzioniz Un’asserzione e’ composta da
y Una risorsax Pagina Web o parte di essa, intero sito Web…x …un documento XML …un libro … qualunque cosa
dotata di URI
y una proprieta’x e.g. Titolo, Data, Tipo
y un valorex es. stringa, numero, frammento XML, un’altra risorsa
Feb-26-03 Cesena
Risorse
z Dalla RFC 2396:z “A resource can be anything that has identity. Familiar examples
include an electronic document, an image, a service (e.g.,"today's weather report for Los Angeles"), and a collection ofother resources. Not all resources are network "retrievable"; e.g.,human beings, corporations, and bound books in a library canalso be considered resources. The resource is the conceptualmapping to an entity or set of entities, not necessarily the entitywhich corresponds to that mapping at any particular instance intime. Thus, a resource can remain constant even when itscontent---the entities to which it currently corresponds---changesover time, provided that the conceptual mapping is not changedin the process”.
Feb-26-03 Cesena
Risorse e URI
z Le risorse sono identificate da URIz La risorsa identificata da una URI
puo’ essere astratta = nonrecuperabile in Rete
z Sintassi: [absoluteURI | relativeURI][“#” fragment-id] /
Feb-26-03 Cesena
Altre visioni di RDF
z Sintassi XMLstandard perrappresentare grafietichettati direttiz Sintassi XMLstandard perrappresentare fatti inlogica del primo ordinesenza variabili
soggetto oggettopredicato
Asserzione :=(predicato,soggetto,oggetto)Predicato = URISoggetto = URIOggetto = URI o costanteOggetto =Predicato(Soggetto)
xmlns:rddl="http://www.rddl.org/"><rddl:resourcexlink:role="http://www.crema.unimi.it/application/java-archive"xlink:arcrole="http://www.rddl.org/purposes/software#xslt-extension"xl:href="thisNS-xslt-extension.jar"><p>le estensioni XSLT definite in questo namespace sono in questo
JAR</p></rddl:resource></rdf:RDF>
Feb-26-03 Cesena
Ontology Engineering
Feb-26-03 Cesena
Comunicazione intelligente usandoontologie
RDF Schema: linguaggio standard perrappresentare e scambiare ontologie
Feb-26-03 Cesena
Tipi di ontologie
Necessità di progettazione modulare basata su templatee di chiara definizione di interfacce