Top Banner
Seminario per il corso di Commercio Elettronico AA 2008 – 2009 tenuto dal Professore F. Dalla Libera A cura di: Barbon Mauro 807071 Loiolino Nicola 806185
12

Slide Seminario Open Calais

May 28, 2015

Download

Education

guest824146b4
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Slide Seminario Open Calais

Seminario per il corso di

Commercio ElettronicoAA 2008 – 2009

tenuto dal Professore F. Dalla Libera

A cura di:

Barbon Mauro 807071Loiolino Nicola 806185

Page 2: Slide Seminario Open Calais

1. Introduzione a Calais2. Reuters3. Introduzione web semantico4. Standard RDF5. Calais nel dettaglio6. Processo di semantizzazione7. Esempi tool: Semantic Proxy8. Esempi tool: Gnosis

Indice

Page 3: Slide Seminario Open Calais

Introduzione a Calais

• Calais si propone di fornire una base di sviluppo semplice e versatile per costruire applicazioni in grado di aggiungere ai contenuti del Web un livello di metadati semantici .

Page 4: Slide Seminario Open Calais

Reuters

• La Reuters è una una delle maggiori agenzie di stampa al mondo facente parte del gruppo inglese Reuters Group plc con sede a Londra.

• Fù Fondata da Paul Julius Reuter (1816-1899) intraprese nel 1850 un servizio di trasmissione di notizie tra Aquisgrana e Bruxelles utilizzando i piccioni viaggiatori.

Page 5: Slide Seminario Open Calais

Introduzione web semantico

il semantic web ha l’obiettivo di dare alle informazioni un significato, correlarle tra loro e rendere le informazioni machine-readable.

Per mettere in pratica questo concetto è necessario un modello, una tecnologia che permetta di identificare le risorse, definirne il significato e le relazioni.

Page 6: Slide Seminario Open Calais

Standard RDF(RDF) Resource Description Framework

• La struttura di una asserzione RDF è composta di una• tripla Soggetto-Predicato-Oggetto

- soggetto, la parte della frase che identifica la cosa descritta

- predicato, la parte che identifica la proprietà (della cosa) che viene specificata dalla frase

- oggetto, la parte che identifica il valore della proprietà

Page 7: Slide Seminario Open Calais

Calais nel dettaglio

• l progetto si compone di tre componenti principali:

• Il Calais Web Service, che si occupa di generare automaticamente metadati in formato RDF

• Una serie di semplici applicazioni per la creazione di nuove applicazioni. Essendo completamente gratuito e open basta registrarsi e richiedere una Developer Key per ottenere le API.

• Un supporto attivo per gli sviluppatori tramite un forum.

Page 8: Slide Seminario Open Calais

Procedimento di Semantizzazione

• 1) l’utente fornisce a Calais contenuti testuali da esaminare.

• 2) Calais estrapola informazioni strutturate dal testo, essendo capace di riconoscere persone, organizzazioni, luoghi, fatti ed eventi che vi sono menzionati;

• 3) Calais genera dei metadati in formato RDF, associandoli permanentemente al documento Web al quale essi appartengono.

• 4) qualunque applicazione semantica conforme agli standards RDF, potrà leggere e comprendere questi metadati, utilizzandoli per i più svariati scopi.

Page 9: Slide Seminario Open Calais

Esempi tool: Semantic Proxy

• Questa utility estrapola le informazioni sensibili da un documento di partenza e le cataloga.

• Nella pagina dei risultati, ciascuna entry possiede un link a una pagina esterna in cui vengono indicati la tipologia del risultato, argomenti simili e pagine riguardanti il risultato stesso.

Page 10: Slide Seminario Open Calais

Pagina dei risultati:

Pagina esterna di uno dei risultati (la voce NASDAQ 100):

Page 11: Slide Seminario Open Calais

Esempi tool: Gnosis• Attraverso l’uso del motore fornito da Calais, Gnosis individua

informazioni chiave su persone, organizzazioni, imprese, prodotti e luoghi geografici sparsi per il testo, distinguendo le varie macro categorie attraverso l’uso di colori differenti.

 Questa è la presentazione originale della pagina:

Page 12: Slide Seminario Open Calais

Si notano sottolineati gli elementi processati. Il colore della sottolineatura indica il tipo dell’informazione.

Nella barra di sinistra invece le voci vengono raggruppate e ordinate secondo la macrocategoria di appartenenza.