Top Banner
Semantic Web e Big Data Applicazioni per l'Information Retrieval e il Knowledge Management Lorenzo Verna M: [email protected] W: tykli.com
54

Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Feb 18, 2019

Download

Documents

vominh
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Semantic Web e Big Data!Applicazioni per l'Information Retrieval e il Knowledge Management

Lorenzo Verna M: [email protected] W: tykli.com

!

Page 2: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Le problematiche dell’Information Age

Espansione dei Volumi!

Varietà / Velocità!

Frammentazione!

Interoperabilità !

Accessibilità!

Page 3: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

La sfida dell’Information Age

In 2002, digital data storage surpassed non-digital for the first time. By 2007, 94 percent of all information on the planet was in digital form.!!!!Source: Researchers at the University of Southern California took four years. "Credit: Todd Lindeman and Brian Vastag/ The Washington Post!!!!

Page 4: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

“There was 5 exabytes of information created between the dawn of civilization through 2003, but that much information is now created every 2 days, and the pace is increasing.” !Eric Schmidt – Google CEO !

Every two days now we create as much information as we did from the dawn of civilization up until 2003.

Page 5: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Page 6: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

!Huge amount of data come from Industries and Organizations activities. -  Health Care and Clinical Data -  Scientific Research

(astronomy, engineering, genetics) -  Finance, Stock exchange -  Market analysis -  News and Editorial Contents -  Applications Logs -  TLC, mobile networks providers -  IoT, sensors -  Public Administration (OpenData) -  Security and Surveillances -  E-commerce: Amazon.com, ebay.com

Page 7: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Big Data

2008 "Big Data" caught on quickly as a blanket term for any collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications. 3V: •  high volume, •  high velocity, •  and/or high variety

Page 8: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

3V Model

•  Volume (amount of data),

•  Velocity (speed of data in and out),

•  Variety (range of data types and sources)

•  Veracity

(data inconsistency, incompleteness, ambiguities, noise vs signal)

Page 9: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Big Data

4/28/13 Bill Howe, UW 3

# of

byt

es

# of data sources

telescopes

spectra

LSST (~100PB; images, spectra)

PanSTARRS (~40PB; images, trajectories)

OOI (~50TB/year; sims, RSN) IOOS (~50TB/year; sims, satellite, gliders,

AUVs, vessels, more) CMOP (~10TB/year; sims, stations, gliders,

AUVs, vessels, more)

SDSS (~400TB; images, spectra, catalogs)

n-body sims

models

AUVs

stations

cruises, CTDs flow cytometry

gliders

ADCP satellites

Astronomy

Ocean Sciences

3 V’s of Big Data Volume Variety Velocity

Page 10: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Big Data

Page 11: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

"Data is the new oil" Ann Winblad

1

Page 12: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

l'Information Retrieval !

Page 13: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Le problematiche dell’Information Age

Espansione dei Volumi!

Varietà / Velocità!

Frammentazione!

Interoperabilità !

Accessibilità!

Page 14: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Information Retrieval

Information retrieval is the activity of obtaining information resources relevant to an information need from a collection of information resources. Searches can be based onmetadata or on full-text (or other content-based) indexing. Automated information retrieval systems are used to reduce what has been called "information overload". Many universities and public libraries use IR systems to provide access to books, journals and other documents. Web search engines are the most visible IR applications.

Page 15: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Information Retrieval

“L'IR è un campo interdisciplinare che nasce dall'incrocio di discipline diverse. L'IR coinvolge la psicologia cognitiva, l'architettura informativa, la filosofia, il design, il comportamento umano sull'informazione, la linguistica, la semiotica, la scienza dell'informazione e l'informatica.”

Page 16: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Information Retrieval Models

 the source of that image is: !Dominik Kuropka: Modelle zur Repräsentation natürlichsprachlicher Dokumente. Ontologie-basiertes Information-Filtering und -Retrieval mit relationalen Datenbanken, ISBN 3-8325-0514-8!

Page 17: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Cognitive models of IR

Berrypicking (Marcia Bates)

Page 18: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Cognitive models of IR

Exploratory Search

Exploratory search: from finding to understanding  Gary Marchionini - CACM April 2006/Vol. 49, No. 4

Page 19: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Tools

Strutture gerarchiche di categorizzazione e classificazione. !Troppo onerose da mantenere e troppo complesso orientarsi.!

Ricerca full-text.!! - Quale domanda fare! - Troppi Risultati! - Zero Risultati!

Page 20: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Graph Data Model

Page 21: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Google Knowledge Graph

http://g.co/knowledge!

Page 22: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Google Knowledge Graph

2012

Its semantic network contained over 570 million objects and more than 18 billion facts about and relationships between different objects.

Page 23: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Facebook Open Graph

Mark Zuckerberg, CEO of Facebook, spoke about his vision for the "open graph" . – September 2011 !

Page 24: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Facebook Open Graph

Page 25: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Linked Data

Insieme di standard W3C per la pubblicazione, condivisione e correlazione di dati strutturati: RDF come modello dei dati, SPARQL per l’interrogazione.

Dati “sparsi” e semanticamente interconnessi attraverso diverse sorgenti:

Da silos di dati al Web of data.

Page 26: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

RDF

Page 27: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Web of Data

Page 28: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Global Data Space

Page 29: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Linked Open Data Cloud

Page 30: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

SPARQL

PREFIX abc: <http://example.com/exampleOntology#>

SELECT ?capital ?country

WHERE {

?x abc:cityname ?capital ;

abc:isCapitalOf ?y .

?y abc:countryname ?country ;

abc:isInContinent abc:Africa .

}

SPARQL Protocol and RDF Query Language

Page 31: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Raw data now

Page 32: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Semantic Web

Page 33: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Network Science

Source: http://barabasilab.neu.edu/networksciencebook/!

Page 34: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Page 35: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Problema dei ponti di Königsberg

Nel 1736 Eulero ha enunciato il seguente teorema:!Un qualsiasi grafo è percorribile se e solo se ha tutti i nodi di grado pari, o due di essi sono di grado dispari; per percorrere un grafo "possibile" con due nodi di grado dispari, è necessario partire da uno di essi, e si terminerà sull’altro nodo dispari.!Tykli _ New ICT Trends _ 27/05/2014

Page 36: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Cammino minimo ecc.

Tykli _ New ICT Trends _ 27/05/2014

Page 37: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Scale-free network

Tykli _ New ICT Trends _ 27/05/2014

Page 38: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Node Centrality

Alcuni nodi che sono più importanti di altri per la configurazione della rete.

Ci sono diverse misure di centralità che colgono diverse peculiarità dei nodi nella rete.

•  Degree Centrality

•  Betweenness Centrality

•  Eignevalue Centrality

Tykli _ New ICT Trends _ 27/05/2014

Page 39: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Degree Centrality

Tykli _ New ICT Trends _ 27/05/2014

Page 40: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Betweenness Centrality

Tykli _ New ICT Trends _ 27/05/2014

Page 41: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Community Detection

Page 42: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

PageRank®

Page 43: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Network Analysis

Page 44: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Network Analysis

Page 45: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Relationship Rank®

Page 46: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Semantic Network

Page 47: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Le problematiche dell’Information Age

Espansione dei Volumi!

Varietà / Velocità!

Frammentazione!

Interoperabilità !

Accessibilità!

Page 48: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

La Risposta

•  Abbiamo più strumenti per affrontare grandi volumi di dati (horse power);

•  Possiamo modellare i dati su strutture a grafo;

•  Possiamo integrare frammenti da sorgenti eterogenee;

•  Possiamo analizzare le reti che ne derivano;

•  Possiamo generare delle mappe di esplorazione;

•  Possiamo rendere semplice e intuitiva l’interfaccia utente;

•  Possiamo garantire la migliore esperienza di fruizione, esplorazione, scoperta.

Page 49: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,
Page 50: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,
Page 51: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,
Page 52: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,
Page 53: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Tykli _ New ICT Trends _ 27/05/2014

Value lies in relationships

Page 54: Semantic Web e Big Data - DiUniTogoy/materiale/1314/Tykli_2014_s.pdf · Semantic Web e Big Data! Applicazioni per l'Information Retrieval e il Knowledge Management ... il design,

Grazie.

Lorenzo Verna M: [email protected] W: tykli.com