Jun 22, 2015
Data Tuesday
Introduction– Bruno Le Dantec (ICT Labs)– François Bancilhon (Data Publica)– Gilles Babinet (Captain Dash, CNN)– Henri Verdier (MFG Labs, Cap Digital)– Stéphane Fermigier (Systematic)
Présentations– Data Publica (Christian Frisch)– Captain Dash (Bruno Walther)– MFG Labs (Julien Laugel)
Débat, Annonces et Questions
Pot
Data Tuesday – 8 novembre 2011
Data Publica développe la connaissance la plus complète et la plus fine des données électroniques françaises
Deux axes de revenu : Jeux de données sur mesure Annuaire et Data Store des données françaises :
• Des jeux de données de vendeurs tiers• Des jeux de données développés par Data Publica
Data Publica
www.data-publica.com
Annuaire L’annuaire de données françaises
le plus complet (depuis septembre 2010)
Périmètre public/privé & gratuit/payant régional/national/européen Focalisé France
180 éditeurs, 5 500 jeux de données, 90% de tableaux
Moteur de recherche Interviews de spécialistes Actualités des données
Data Store depuis octobre 2011
5
Editeurs
Web (OpenData)
Data Broker• Multiformat• Visualisation• API (géolocalisation)• Recherche (concepts)• Liens Jeux de données
DonnéesStructurées
Infrastructure technique
Linked Data
Linked Data• Web Sémantique
Usage/Social
Métadonnées
Données brutes
Crawl /filtrage
Scraping
Classification
Annuaire• Recherche (meta & full text)• Aperçu des données• Commentaires• Recommandations/Notation
Data Store• Téléchargement• Abonnement
ETL
Outils INRIA/Zenith:• Extraire les tableaux (reconnaissance de formes)• Identifier les données & leur nature (colonnes)• Exporter la structure (format DSPL)
Structurer les données ouvertesEtape 1 : Analyse
Structurer les données ouvertesEtape 2: Publication
http://api.data-publica.com/…/content.json? limit=10&filter={revenue_fiscal_par_foyer:{$gt:25000}}
• Multi format (json, xml, spreadsheet,csv)• Requêtes géolocalisées• Mashups
Structurer les données ouvertesEtape 3: Accès
Accès API gratuit(Interrogation/Visu) Accès API payant
Téléchargement(payant)
RechercheBases de données
Téléchargement(gratuit)
RechercheJeux de données
Editeurs
Jeux de données payants
Web
Open Data