Top Banner
Ze Ontology News Extractor Celui qui contrôle les données contrôle le web Pour le concours BoostYourCode 2012 Christophe DESCLAUX
48

ZONE présenté au concours BoostYourCode

Jul 20, 2015

Download

Documents

descl
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: ZONE présenté au concours BoostYourCode

Ze Ontology News Extractor

Celui qui contrôle les données contrôle le web

Pour le concours BoostYourCode 2012

Christophe DESCLAUX

Page 2: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

2

Christophe Desclaux

CONTEXTE

Ingénieur Informatique

Knowledge Information Systems

Page 3: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

3

Mes engagements

Aide à la mise en place de serveurs

Animation de conférences

vice président

Organisation des « Journées Méditerranéennes du Logiciel Libre » depuis 2009

CONTEXTE

Page 4: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

4

CONTEXTE

Cas d'utilisation

Que se passe-t-il dans l'écosystème de la fondation Apache en ce moment ?

Page 5: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

5

Problématique

Agrégation d'informations

Regroupement par catégories

Recherche d'informations efficace

CONTEXTE

Page 6: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

6

Les solutions existantes CONTEXTE

Mémoire de

lectures

installablelibre

Agrégation de

flux RSS

Page 7: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

7

Les flux RSS

Contenu produit automatiquement

Sites d'actualité / blogs

Dialecte XML

CONTEXTE

Page 8: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

8

Les solutions existantes CONTEXTE

Multiplicité des

sources

Sémantique

.FR

Page 9: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

9

Web sémantique

Contenus accessibles aux ordinateurs

Sources interconnectés

Des vocabulaires partagés

Page 10: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

10

Les solutions existantes CONTEXTE

Sémantique

Regroupement

GratuitMultiplatefor

meMultiplicité

des sources

Page 11: ZONE présenté au concours BoostYourCode
Page 12: ZONE présenté au concours BoostYourCode
Page 13: ZONE présenté au concours BoostYourCode
Page 14: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

14

Gratuit

Recherchemulti-critères

Mémoire delecture

Libre

Installable

Regroupement

Multi-plateforme

Multiplicitédes sources

Sémantique

CONTEXTE

Page 15: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

15

Ze Ontology News Extractor

Présentation du prototype

ZONE(UR) CONTEXTE

Page 16: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

16

FluxFlux RSS

ZONE(UR) CONTEXTE

Page 17: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

17

Lecteurde flux

Flux RSS

Flux

News

ZONE(UR) CONTEXTE

Page 18: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

18

Lecteurde flux

Flux RSS

Flux

Annotateur

WikiMeta

Organisations

Personnalités

Objets

GeoMeta

OpenCalais

INSEE Geo

Annotation des flux

Entrée : texte de la news

Sortie : annotations

News

ZONE(UR) CONTEXTE

Page 19: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

19

Stockage des

Flux annotésBDD

Flux RSS

Item annoté

Flux Items annotés

News

ZONE(UR) CONTEXTE

Lecteurde flux

AnnotateurAnnotateur

Page 20: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

20

Stockage des

Flux annotésBDD

Flux RSS

Item annoté

Flux Items annotés

ZONE

Serveur d'annotation sémantique

News

ZONE(UR) CONTEXTE

Lecteurde flux

AnnotateurAnnotateur

Page 21: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

21

besoinutilisa

teur

ZONE(UR) CONTEXTE

Evenements ville Montpellier

Page 22: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

22

critèresÉlément deconfiguratio

nbesoin

utilisateur

ZONE(UR) CONTEXTE

Evenements ville Montpellier

Page 23: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

23

critèresÉlément deconfiguratio

nbesoin

utilisateur

Créationrequête

ZONE(UR) CONTEXTE

Page 24: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

24

BDD

critèresÉlément deconfiguratio

nbesoin

utilisateur

RéponseCréationrequête

Requête

ZONE(UR) CONTEXTE

Page 25: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

25

BDD

critères

Flux RSS

Élément deconfiguratio

nbesoin

utilisateur Transformatio

n

RéponseCréationrequête

ZONE(UR) CONTEXTE

Requête

Page 26: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

26

Clients possibles :

Smartphone

Interface WEB

Plugins

BDD

critères

Flux RSS

Élément deconfiguratio

nbesoin

utilisateur Transformatio

n

RéponseCréationrequête

ZONE(UR) CONTEXTE

ZONEUR Requête

Page 27: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

27

Stockage des

Flux annotésBDD

critères

Flux RSS

Flux RSS

Élément deconfiguratio

nbesoin

Item annoté

Flux Items annotés

Annotateur

ZONEUR

utilisateur Transformatio

n

RéponseCréationrequête

ZONE

News

ZONE(UR) CONTEXTE

Lecteurde flux

AnnotateurAnnotateur

Requête

Page 28: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

28

État actuel du prototype

Etude du web sémantique

Démarche d'architecture logicielle

Diffusion à la communauté scientifiqueCIEL 2012 : Conférence en IngénieriE du Logiciel

ZONE(UR) CONTEXTE

Proof of concept : http://zone.zouig.orgCode : http://github.com/descl/ZONE

Page 29: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

29

Apports communautaires

Publication API Java

Correction de bugs

ZONE(UR) CONTEXTE

Corese

Page 30: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

30

Place à la démo

ZONE(UR) CONTEXTE

Page 31: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

31

ZONE(UR) CONTEXTE

http://zone.zouig.org

Page 32: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

32

ZONE(UR) CONTEXTE

http://zone.zouig.org

Page 33: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

33

ZONE(UR) CONTEXTE

http://zone.zouig.org

Page 34: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

34

ZONE(UR) CONTEXTE

http://zone.zouig.org

Page 35: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

35

ZONE(UR) CONTEXTE

http://zone.zouig.org

Page 36: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

36

BoostMyZONE

Permettez moi de concrétiser mon projet !

BoostMyZone ZONE(UR)

CONTEXTE

Page 37: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

37

Apports du projet BoostMyZone

ZONE(UR) CONTEXTE

Page 38: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

38

Choix de la licence

Serveur : licence GPL v3

Classique

Connue et reconnue

Compatible avec la licence Apache

Client : licence AGPL

Moins permissive

Prise en compte de la distribution sous forme de service

BoostMyZone ZONE(UR)

CONTEXTE

Page 39: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

39

OrganisationWP1 : la communauté

Présentation au public

Appels à contributions

WP2 : le serveur d'annotation

Passage à l'échelle

Ajout de services d'annotations

Data clustering

WP3 : les clients

Amélioration visuelle

Client android

BoostMyZone ZONE(UR)

CONTEXTE

Page 40: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

40

Pourquoi me financer ?

CO

N

C

L

U

S

IO

N

BoostMyZone ZONE(UR)

CONTEXTE

ZONE(UR) CONTEXTE

Page 41: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

41

Merci de votre attention

“J’ai un double rêve pour le Web. D’une part, je le vois devenir un moyen très puissant de coopération entre les êtres humains. Et dans un second temps, j’aimerais que ce soit les ordinateurs qui coopèrent. Quand mon rêve sera réalisé, le Web sera un univers où la fantaisie de l’être humain et la logique de la machine pourront coexister pour former un mélange idéal et puissant.” Tim Berners-Lee

CO

N

C

L

U

S

IO

N

BoostMyZone ZONE(UR)

CONTEXTE

ZONE(UR) CONTEXTE

Merci à Mireille Blay-Fornarino, Christian Brel, Luc Champalle, Patrice Deschaux, Catherine Faron-Zucker, Amélie Gyrard, Romaric Pighetti, Matti Schenider et Simon Urli pour leur aide précieuse

Page 42: ZONE présenté au concours BoostYourCode

Rédaction d'un article scientifique pour la conférence CIEL

Page 43: ZONE présenté au concours BoostYourCode

Planning prototype

Octobre / Novembre : découverte du sujet, étude bibliographique et recherche de solutions existantes

Plein temps décembre (2s) : Étude des différents services d'annotation possibles , tests poussés des solutions et rédaction de tests unitaires pour vérifier les problèmes de régression

Janvier : Construction du workflow d'annotation

Février : Spécification concernant la première version du service de filtrage

Plein temps Mars (2s) : Finalisation du service de filtrage et rédaction de l'article scientifique

Page 44: ZONE présenté au concours BoostYourCode

Valorisation commerciale

Les entreprises on besoin d'installer ce genre d'application sur leurs machine

Fournir des solutions de consulting pour projets de pilotage

Ajout de nouveaux services d'annotation dictés par les besoins d'entreprises

Page 45: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

45

Apports communautaires

Projet WikiMeta (annotateur)

Publication API Java

Correction de bugsProjet 4Store (serveur RDF)

Rapport de bugs concernant la suppression d'informations par requêtes Sparql

Projet Corese (Moteur SPARQL)

Rapport de bug concernant des problèmes de performance sur de grands jeux de données

Librairie 4store-ruby

Fork de l'application pour permettre des requêtes

ZONE(UR) CONTEXTE

Page 46: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

46

Aspects juridiques

Droit d'auteurs

Droit de citation

Respect de la vie privée

Rester hébergeur et non éditeur de contenu

Page 47: ZONE présenté au concours BoostYourCode

CONTEXTE ZONE(UR) BoostMyZone !

47

ZONE(UR) CONTEXTE

http://zone.zouig.org

Page 48: ZONE présenté au concours BoostYourCode

T12T10T8T6T4T2T0T-2

Communauté

Serveur

Client

Présentation au public

Diffusion prototype

Compilation des retours

Appel à contribution

Gestion d'un grand nombre de flux

Ajout de services d'annotation

Agrégation des news similaires

Amélioration visuelle du client web

Doc sur la création de clients

Création d'autres clients

Fourniture d'un client final

Planning