Top Banner
Usare al meglio strumenti come Dandelion API e Atoka per estrarre informazioni utili al proprio lavoro Matteo Brunati - Community Manager SpazioDati - @dagoneye Corso “Media digitali e Data Journalism” 19 novembre 2015
69

Dandelion API e Atoka: due strumenti utili al Data Journalism

Feb 13, 2017

Download

Technology

SpazioDati
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Dandelion API e Atoka: due strumenti utili al Data Journalism

Usare al meglio strumenti come Dandelion API e

Atokaper estrarre informazioni utili al proprio lavoro

Matteo Brunati - Community Manager SpazioDati - @dagoneye

Corso “Media digitali e Data Journalism” 19 novembre 2015

Page 2: Dandelion API e Atoka: due strumenti utili al Data Journalism

chi sono

dagoneye.it

Page 3: Dandelion API e Atoka: due strumenti utili al Data Journalism

Ci serve partire da lontano

Contesto tra Web of Data e

Web as Content

Strumenti per giocare con

entrambi, grazie al lavoro di SpazioDati

Page 4: Dandelion API e Atoka: due strumenti utili al Data Journalism

obiettivo: quale?

consapevolezza

scenari e il mondo del possibile

collegamenti tra mondi diversi

Page 5: Dandelion API e Atoka: due strumenti utili al Data Journalism

...uno spunto per partire...

Page 6: Dandelion API e Atoka: due strumenti utili al Data Journalism

WHAT and WHY

“la fonte, il dato” devono tornare ad

essere un tema centrale #fact-checking

Page 7: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://datadrivenjournalism.net/news_and_analysis/How_to_become_a_data_journalist_Day_3

Page 8: Dandelion API e Atoka: due strumenti utili al Data Journalism

quindi sembra facile oggi...

Page 9: Dandelion API e Atoka: due strumenti utili al Data Journalism

Ed invece no: siamo tutti nella stessa barca.Il Web crea innovazione distruttiva in tutti gli ambiti,e serve una nuova disciplina per capirne le dinamiche

Web Science

http://en.wikipedia.org/wiki/Web_Science_Trust

Page 10: Dandelion API e Atoka: due strumenti utili al Data Journalism

modellidi business

intermediazione

competenze catena del valore

anche il giornalismo è in costante cambiamento

Page 11: Dandelion API e Atoka: due strumenti utili al Data Journalism

ma qualche percorso esiste, e si staconsolidando...

Page 12: Dandelion API e Atoka: due strumenti utili al Data Journalism

:)

Page 13: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://datajournalismhandbook.org/1.0/en/

ecco il tema dei DATI

Page 14: Dandelion API e Atoka: due strumenti utili al Data Journalism

approfondiamoquesti dati allora...

Page 15: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/

fonti “sporche”

fonti strutturate

Web di documenti

Web di dati

Page 16: Dandelion API e Atoka: due strumenti utili al Data Journalism

diamo uno sguardo a questi dati strutturati...

fonti strutturate

Web di dati

Page 17: Dandelion API e Atoka: due strumenti utili al Data Journalism

Per capire il WEB dei dati, serve fare un ripassosu cosa sia il WEB

Page 18: Dandelion API e Atoka: due strumenti utili al Data Journalism

sappiamo cos’è il WEB ed abbiamocapito perchè è nato?

Page 19: Dandelion API e Atoka: due strumenti utili al Data Journalism

Il Web in un paper nel 1989, ed aveva già molto oltre semplici link

ai documenti

Page 20: Dandelion API e Atoka: due strumenti utili al Data Journalism

Il web come spazio di condivisione delle

informazioni, che PERMANE, e decentralizzato

a chi devo chiedere di inserire un link?

avevo l’email e gli allegati: cosa mi offre in

più?

Page 21: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://www.garrygolden.net/2010/01/30/davos-2010-ideas-lab-talks-from-mit-group-on-nature-of-social-and-connected-intelligence-5-videos/

Page 22: Dandelion API e Atoka: due strumenti utili al Data Journalism

principio del Least Power,ovvero umiltà del design

Page 23: Dandelion API e Atoka: due strumenti utili al Data Journalism

con il riuso che è insito nella trasparenza della struttura del Web...

http://www.shirky.com/writings/view_source.html

Page 24: Dandelion API e Atoka: due strumenti utili al Data Journalism
Page 25: Dandelion API e Atoka: due strumenti utili al Data Journalism

cos’è un testo?

contenuto

contenitoreparagrafi

titolipiè di pagina

immagini

Page 26: Dandelion API e Atoka: due strumenti utili al Data Journalism

[paragrafo] Paperino è a casa a Milano. [fine paragrafo]

questo testo è all’interno di un documento,nel mio disco fisso.

se lo pubblico online, avrà una formaed un indirizzo per essere trovato

URI

HTML

Page 27: Dandelion API e Atoka: due strumenti utili al Data Journalism

Il problema è che la “macchina” capisce che ad un certo indirizzo c'è un contenuto in HTML, ma non

comprende di cosa parla quel contenuto, è cieca

Page 28: Dandelion API e Atoka: due strumenti utili al Data Journalism

Ed ecco perché si va verso il mondodei Linked Data

Page 29: Dandelion API e Atoka: due strumenti utili al Data Journalism

Linked Data è pubblicare i dati online,ma non solo sul Web,

ma anche NEL Web

Page 30: Dandelion API e Atoka: due strumenti utili al Data Journalism

LINKED OPEN DATA CLOUD

Page 31: Dandelion API e Atoka: due strumenti utili al Data Journalism

Diversi livelli di avvicinamento in questo percorso

I dati Linked sono fatti per essere letti dai

programmi

Page 32: Dandelion API e Atoka: due strumenti utili al Data Journalism

Linked Data è una delle sintesi migliori del vecchio nome “Semantic Web”

Linked Data è già OGGI una delle fonti, ed è quella più complessa, perché

pensata per le macchine

Page 33: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://www.guardian.co.uk/help/insideguardian/2010/jan/25/news-linked-data-summit

Page 34: Dandelion API e Atoka: due strumenti utili al Data Journalism

Ce ne sono molte ormaiin giro... e dovete sapere che

ce ne saranno sempre di più...

Page 35: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://data.nature.com/

Page 36: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://data.nytimes.com/

Page 37: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://dati.camera.it

Page 38: Dandelion API e Atoka: due strumenti utili al Data Journalism

it.dbpedia.org

Page 39: Dandelion API e Atoka: due strumenti utili al Data Journalism

Così un po' abbiamo digeritol'idea del Semantic Web: rendere

la macchina capace di tracciare LINK

e RELAZIONI con il contenuto,andando oltre alla pagina come

elemento atomico del contenuto...

Page 40: Dandelion API e Atoka: due strumenti utili al Data Journalism

“A thing is defined by its relationships”

Page 41: Dandelion API e Atoka: due strumenti utili al Data Journalism

…relazioni che creano percorsi pensati per essere visti dalle macchine:ovviamente come non pensare

alla SEO? :)

Page 42: Dandelion API e Atoka: due strumenti utili al Data Journalism

SEO = Search Engine Optimization,

ovvero come farsi trovare dai motori di ricerca:

che sono di nuovo “macchine”:)

Page 43: Dandelion API e Atoka: due strumenti utili al Data Journalism

e questo Web di Dati oggi è già dentrole pagine tradizionali, in forme ibride...per farti trovare quel contenuto che...

Facebook OpenGraph

Google Rich Snippets via Google Knowledge

Graph

Open Data( Community e

gov )

Google Cards sulle SERP

Page 44: Dandelion API e Atoka: due strumenti utili al Data Journalism

Ci sono alcuni determinati formati nelle pagine,tutti col nome “dati strutturati”

http://webdatacommons.org/structureddata/index.html#results-2013-1

Page 45: Dandelion API e Atoka: due strumenti utili al Data Journalism

BestBuy con i dati strutturati nella pagina

http://www.stateofdigital.com/semantic-web-business-models-marketing-perspective/

Page 46: Dandelion API e Atoka: due strumenti utili al Data Journalism

per provare a vedere questi strati di

informazione strutturata

https://developers.google.com/structured-data/testing-tool/

Google structured data testing tool

Page 47: Dandelion API e Atoka: due strumenti utili al Data Journalism

ma io “giornalista”, con questi Linked Data, perchè devo averci a che fare?

stimolare i programmatori ed i tecnici a darmi una mano, consapevole che

esistono quei dati e quelle fonti

chiedere lumi a chi li ha pubblicati, come con quelli

Open Data + semplici: stimolare

feedback e miglioramento continuo

Page 48: Dandelion API e Atoka: due strumenti utili al Data Journalism

fonti “sporche”

fonti strutturate

Web di documenti

Web di dati

Page 49: Dandelion API e Atoka: due strumenti utili al Data Journalism

fonti “sporche”

Web di documenti

contenuto non strutturato come i testi

“messy” data,ovvero semi-strutturato

Big ContentOpen Data, ed annessi

Page 50: Dandelion API e Atoka: due strumenti utili al Data Journalism

ne avremo sempre più di quello non strutturato, perché siamo PIGRI :)

Page 51: Dandelion API e Atoka: due strumenti utili al Data Journalism

e di più...

Page 52: Dandelion API e Atoka: due strumenti utili al Data Journalism

Anche se chi li pubblica, sarà sempre

più attento

Page 53: Dandelion API e Atoka: due strumenti utili al Data Journalism

Contenuto non strutturato

Text mining / data mining+

=report ed oggettiche diano un senso econ cui “giocare”

Page 54: Dandelion API e Atoka: due strumenti utili al Data Journalism

“What I do is text analysis, which covers the aggregation of texts, machine learning, natural language processing, applied to text files to understand the context. There is a specific set of skills for data journalists to learn, as it is more and more becoming common place to find information in text files, ranging from material published by governments to corporations. And if you can learn those skills you can start to

find meaningful patterns in these documents.”

http://blogs.dw.de/innovation/data-science-the-software-that-is-out-there-is-getting-easier-to-use/

Page 55: Dandelion API e Atoka: due strumenti utili al Data Journalism

ed ora proviamo a capire come funzionail text mining con uno strumento

che ci dirà “qualcosa” su un testo...

Page 56: Dandelion API e Atoka: due strumenti utili al Data Journalism

https://dandelion.eu

API, ovvero oggetti manipolabili dai

programmatori / macchine

Page 57: Dandelion API e Atoka: due strumenti utili al Data Journalism

cosa si può fare

Page 58: Dandelion API e Atoka: due strumenti utili al Data Journalism

Non solo per tecnici, stiamo lavorando anche per gli analisti…

Page 59: Dandelion API e Atoka: due strumenti utili al Data Journalism

parlando di dati strutturati non ci sono solo i Linked Data… che sono per tecnici

fonti strutturate

Web di dati

Page 60: Dandelion API e Atoka: due strumenti utili al Data Journalism

ci sono anche siti che permettono

di navigare nei dati, aggregandoli in modi e mondi dotati di senso

fonti strutturate

Web di dati

Page 61: Dandelion API e Atoka: due strumenti utili al Data Journalism

https://atoka.io

Page 62: Dandelion API e Atoka: due strumenti utili al Data Journalism

fonti “sporche”

fonti strutturate

Web di documenti

Web di dati

https://atoka.io

Dati closed - Cerved

Page 63: Dandelion API e Atoka: due strumenti utili al Data Journalism

Giusto per dare un’idea…

Page 64: Dandelion API e Atoka: due strumenti utili al Data Journalism

Ed ora, mettiamo le mani in pasta...

Page 65: Dandelion API e Atoka: due strumenti utili al Data Journalism

Text analytics su GDrive usando Dandelion API Demo RASFF - http://bit.ly/RASFF_data

Web di dati

Contenutonon strutturato

https://dandelion.eu/semantic-text/entity-extraction-demo/

https://developers.google.com/structured-data/testing-tool/https://developers.facebook.com/tools/debug/og/object/

Ovvero confrontare le testate dei giornali nel modo in cui fanno parte del Web dei dati / non strutturato

Page 66: Dandelion API e Atoka: due strumenti utili al Data Journalism

Alcuni link veloci condivisi in un pirate pad

http://piratepad.net/K3WHEAqwlJ

Page 67: Dandelion API e Atoka: due strumenti utili al Data Journalism
Page 68: Dandelion API e Atoka: due strumenti utili al Data Journalism

http://www.edizionilswr.it/libri/creare-valore-con-big-data/