Formation interne des personnels de L’Université Paris 1 Panthéon-Sorbonne Utilisation professionne lle des flux RSS Support réalisé à partir des interventions de Corinne Habarou (Urfist de Paris), François Magnant (Consultant), Armelle Thomas (InsituCréa), Martine Goujon (AURG), Etienne Cavalié (BU de Nice) et aussi de wikipédia… Jeudi 10 avril 2014 Intervenant : Stéphane Dufournet, BIU Cujas Définir, identifier, moissonner, veiller
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Formation interne des personnels de
L’Université Paris 1 Panthéon-Sorbonne
Utilisation professionnelle des flux RSS
Support réalisé à partir des interventions de Corinne Habarou (Urfist de Paris), François Magnant (Consultant), Armelle Thomas (InsituCréa), Martine Goujon (AURG), Etienne Cavalié (BU de Nice) et aussi de wikipédia…
Jeudi 10 avril 2014Intervenant : Stéphane Dufournet, BIU Cujas
Définir, identifier, moissonner, veiller
I. Définition*Qu'est ce que la syndication de contenu ?
* Comment fonctionne le flux RSS ?
* Flux ou pas flux ?
* Avantages des flux RSS
* Les formats de production
* Paramétrage des flux
* Les formats d’échange
*Qu'est ce que la syndication de
contenu?
La syndication de contenu Web désigne un processus : le partage de contenu entre sites ou portails dans laquelle une partie d'un site est accessible depuis d'autres sites.
Le « Really Simple Syndication » ou RSS une application pratique de ce processus permettant de créer un fichier résumant les dernières informations du contenu d'un site web sous la forme de «flux de syndication», souvent appelés «fil» ou «flux» RSS.
Défin
itio
n
Exemple de syndication éditoriale : Le Comité Régional du Tourisme de Picardie (CRT) et les Agences de Développement et de Réservations touristiques (ADRT) de l'Aisne, l'Oise et la Somme ont adopté depuis plusieurs années le Système Régional d'informations Touristiques (SRIT), qui vise à rendre l'information touristique régionale la plus accessible possible. Les acteurs ont décidés de la partager en permettant aux partenaires touristiques qui le souhaitent, de réaliser la publication automatisée de l'information touristique sur leurs sites web par le biais du RSS.http://www.oisetourisme-pro.com/Vos-outils/Internet-Tourisme/Le-SRIT-et-ses-services/Systeme-Regional-d-Info-Touristique
* Le flux RSS est un fichier XML dont le contenu est produit automatiquement en fonction des mises à jour d’un site Web.
* Ce fichier reprend sous forme de données structurées les éléments essentiels d’un article (à minima le titre, la description, la date de publication et le lien vers l’article).
* Le fichier est converti en HTML par un logiciel appelé « agrégateur » afin de faciliter sa lecture, à partir du moment ou l’utilisateur s’est « abonné » à un flux RSS via son logiciel.
* Après abonnement, l’utilisateur reçoit automatiquement les mises à jour sans devoir retourner au préalable sur le site concerné.
Défin
itio
n
Description du processus de syndication sur http://fr.openclassrooms.com/informatique/cours/syndication-de-contenu-rss-avec-atom/generalites-sur-la-syndication-de-contenu
il faut se rendre sur chaque site web via son navigateur
Il faut consulter les informations sélectionnées et transmises par son réseau social (Twitter, Facebook, etc.)
Avec flux RSS, pour consulter des nouveautés : on utilise son lecteur de flux RSS (agrégateur) multisources les informations sont automatiquement délivrées à l’utilisateurcette technologie génère du « bruit » : réception d’informations non pertinentes pour un utilisateur précis
Défin
itio
n
*Avantages des flux RSS
Être prévenu dès que de nouvelles informations sont publiées ou rendues accessibles
Sans avoir à se connecter aux sites eux-mêmes (Push)
Pouvoir consulter en un endroit unique, centralisé
Texte ou fichiers multimédias (podcasts)
Contenu manipulable par l’usager
Défin
itio
n
*Les formats de production
Il existe de nombreux formats pour les flux de syndication. On parle généralement du format RSS, mais l'histoire de ce format est mouvementée : de nombreux formats concurrents et souvent incompatibles ont été proposés par différentes organisations au début des années 2000.
* Trois formats ont émergé de par leur nombre d’utilisateurs :
* RDF (Resource Description Framework ) Site Summary ou RSS 1.0. Un document structuré en RDF décrit un triplet : sujet (la ressource), prédicat (ses propriétés), objet (sa représentation).
* Really Simple Syndication ou RSS 2.0 : ce format respecte le schéma XML soit : <title>, définit le titre du flux ; <description>, décrit succinctement le flux ; <link>, définit l'URL du site correspondant au flux.
* Atom 1.0 : toujours basé sur le schéma XML, Atom est plus avancé techniquement que RSS avec plusieurs avantages : interopérabilité, description de document multimédia, etc. En pratique, Atom est souvent masqué par le sigle plus connu des internautes. Par exemple, les flux de http://www.theses.fr/ sont codés <link rel="alternate" type="application/atom+xml" title="Theses.fr Flux Atom" href="/?q=&sort=dateSoutenance+desc&format=atom"/>
* Il existe aussi les formats moins utilisés RSS 0.90 ou encore RSS 0.91(proche de RSS 1.0 car tous deux basés sur RDF); À l'heure actuelle, c'est RSS 2.0 qui s’est imposé.
La syntaxe URL d’un flux est le plus souvent assez simple : URL du site/feed ou /rss. On peut ensuite combiner des critères si la source des flux RSS l’autorise.
http://hal.archives-ouvertes.fr/rss.php?published=2005 pour s'abonner aux articles de l'archive publiés en 2005.
authornom de l'auteur à rechercher
http://hal.archives-ouvertes.fr/rss.php?author=alain_martin pour s'abonner aux articles déposés aujourd'hui dont un des auteurs Martin
labnom (sigle, nom, tutelle) du labo
http://hal.archives-ouvertes.fr/rss.php?lab=UMR8549 pour s'abonner aux articles déposés aujourd'hui affluxié au labo UMR8549
researchteam
nom de l'équipe à rechercher
http://hal.archives-ouvertes.fr/rss.php?researchteam=AduPRO pour s'abonner aux articles déposés aujourd'hui par l’équipe AduPRO
type de publication
codes des types de publication
http://hal.archives-ouvertes.fr/rss.php?type=ART_ACL pour s'abonner aux articles déposés aujourd'hui de type ART_ACL (article dans des revues avec comité de lecture)
domaincodes domaines à rechercher
http://hal.archives-ouvertes.fr/rss.php?domain=PHYS pour s'abonner aux articles déposés aujourd'hui du domaine PHYS
HAL
Combinaison possible de ces paramètres dans HAL. Pour cela, vous devez les séparer par le caractère & (ex : http://hal.archives-ouvertes.fr/rss.php?from=monthly&lab=UMR8549 )
RUE89
Pour obtenir le flux RSS d’un thème précis, ajoutez /feed à la fin de son URL. Par exemple, l’adresse du flux RSS des articles sur l’Inde est : http://www.rue89.com/inde/feed
Pour obtenir le flux RSS d’un blog, ajoutez /feed à la fin de son URL. Par exemple, le flux RSS du blog Derrière le barreau est : http://blogs.rue89.com/derriere-le-barreau/feed
Ce format d’échange de données est basé sur le langage XML. Son usage est multiple (groupes de discussion, chats), le plus commun d'entre eux étant l'échange de listes de flux RSS.
Il permet :
* D’identifier les titres d'un texte et de les regrouper dans une liste
* De récupérer une sélection faite par une autre personne
* De faire migrer ses flux RSS d'un outil à l'autre
un bon lecteur de flux doit proposer
l’export OPML
Défin
itio
n
II. Identification* Quels types de sites produisent des flux RSS ?
* Pour quels contenus ?
* Des flux d’alertes ciblées : catalogue de bibliothèque, cours en ligne sur Moodle, Google Alertes
* Des flux d’actualités thématiques : portail de veille, Google Actualités
* Des flux de sommaires de revues ou d’évènements d’agenda
* Des flux issus d’outils de curation, de blogs, de socialbookmarking
* Des flux d’images (Pinterest, Tumblr)
* Où trouver des répertoires de flux RSS ?
* Identifier les flux sur un site
* Identifier les flux via son navigateur
* Quels types de sites produisent des flux RSS ?
* Magazines, revues, sites de presse écrite ou audiovisuelle
* agences de presse (http://www.reuters.com/tools/rss)
* Sites institutionnels
* Blogs
* Sites de commerce électronique (Amazon)
* Sites collaboratifs et sites de partage
* Répertoires de signets (sur mon compte Diigo : https://www.diigo.com/network/dufournet)
* Moteurs de recherche et bases de données, archives ouvertes (Hal)
Il est possible de générer des flux RSS à partir de plusieurs modules de la plateforme de cours en ligne MOODLE : blog, base de données, forum, glossaire…
Cette plateforme est utilisée par les nouveaux EPI de l’université Paris1 :
* Dans les paramètres du forum, dans la section RSS, il faut choisir discussion ou message et le nombre d'articles à afficher
* L’étudiant s’abonne en utilisant les réglages dans la colonnes de gauche, sur la page du forum
Production de flux RSS (ici dans la version payante)
Captation de flux
contenus dans
Twitter ou Facebook
Mise en forme
éditorialisée
L‘agrégation web ou curation de contenu est l'action de regrouper, sélectionner des pages concernant un sujet précis et de les présenter, après mise en forme automatique, dans un blog.
Identi
fica
tion
paper.li permet de créer automatiquement un journal en ligne, à partir de ses sources d'informations (Twitter, RSS...)
Tumblr, est une plate-forme de reblogage qui permet à l'utilisateur de poster du texte, des images, des vidéos, des liens et des sons sur son tumblelog. * Il est essentiellement utilisé pour rebloger des images animées
* On peut visualiser un flux sous forme de texte et/ou d’images (cela dépend de l’agrégateur utilisé)
* Il existe des universités (Grenoble par exemple) proposant des podcast de cours : http://podcast.grenet.fr/structures/ujf/journees-ticealpes-2012/
* Tous les grands médias proposent ce type d’abonnement pour leurs émissions : par exemple sur France Inter, rendez-vous directement depuis les pages des émissions en cliquant sur l'icône de podcast puis sur "s'abonner au podcast via RSS » http://radiofrance-podcast.net/podcast09/rss_11739.xml
* Le site du Collège de France propose deux modes d’abonnement : par Itunes, par flux RSS simplifié (XML brut) http://www.college-de-france.fr/site/podcasts/
*Firefox : Autrefois native (jusqu’à FF 3.X), l’icône signalant la présence de flux RSS peut être rétablie via des extensions comme RSS Icon in Url bar
*Chrome : Extension Abonnement RSS (par Google), pas toujours très fiable
*Safari : Extension FeedButton ou Subscribe to feed. Egalement prise en charge native de la fonctionnalité Autodiscovery.
* Internet Explorer : Prévu nativement dans la barre de commandes (à activer via Option Internet/Contenu/Flux/activer web Slice). Lorsqu’un composant Web Slice est disponible sur une page Web, le bouton apparaît dans la barre de commandes
* Caractéristiques* Fonctionnalités * Critères de choix
* Typologie d’outils
* Le gestionnaire RSS du logiciel de messagerie
* Le gestionnaire RSS des navigateurs
* Les agrégateurs embarqués dans le navigateur
* Une extension Firefox : Sage
* Les agrégateurs monopostes
* Les agrégateurs en ligne : avantages, typologie
* Un lecteur en ligne : Feedspot* Un lecteur en ligne : Feedly* Un mixeur de flux : Yahoo Pipes* Un service d’alerte et de statistique : Feedburner* Un portail personnalisable : Netvibes
* Caractéristiques d’un agrégateurRSS
* Les agrégateurs permettent de « s'abonner » à des flux RSS et de les regrouper au sein d’un même outil de lecture
* Ces logiciels font régulièrement le tour de tous les flux RSS auxquels un internaute est abonné et lui signalent automatiquement les nouveautés apparues dans le fichier...
* Leurs fonctionnalités dépendent de leur mode d’implémentation (installation sur poste client, sur serveur, hébergé chez un éditeur de service …)
* Il en existe un grand nombre et le choix dépend du rapport entre la richesse fonctionnelle et les besoins et usages de l’utilisateur
Mois
sonn
er
*Fonctionnalités d’un agrégateur
RSS
* Fonctions principales* Import / export de flux
* Abonnement rapide
* Organisation dans des dossiers et sous-dossiers
* Moteur de recherche
* filtrage
* Signalement d’articles (liste de suivi, taguage)
* Marquage comme lu ou non lu de chaque article
* Personnalisation à minima de l’affichage des articles
* Configuration du délai de préservation des flux de manière globale, voire par flux
* Fonctions collaboratives (groupes privés)
* Facilité d’accès aux différentes fonctionnalités
* Fonctions de médiation* Partage d’articles sur des services Web 2.0
* Rediffusion automatique de la veille par flux RSS et/ou HTML
* Accès mobile sur tablette ou smartphone
Mois
sonn
er
*Critères de choix d’un agrégateur
RSS
Mois
sonn
er
*Le gestionnaire RSS du logiciel de
messagerie
Les points forts communs : * Archivage des flux
* Lecture hors connexion
* filtres de rediffusion automatique
* Fonctions de recherche évoluées
* Lecture des courriels et des flux avec le même outil
Les points faibles : * Présentation inadaptée
* Pas d’autre possibilité de rediffusion que le transfert par mail
* Pas de rediffusion HTML ou RSS d’articles possible
* Pas d’accès mobile
Mois
sonn
er
*Le gestionnaire RSS des
navigateurs
Attention : les navigateurs ont abandonné la fonction de signalement automatique des flux dans la barre d’adresse. Il faut installer une extension qui permet de repérer la présence d’un flux RSS (voir Identifier les flux via son navigateur)
* Internet Explorer : RSS Autodiscovery, possibilité d’archivage, fréquence de rafraîchissement réglable.
* Firefox : RSS Icon et système des marque-pages dynamiques
* Safari : RSS Autodiscovery et gestion des abonnements via les signets.
* Google Chrome : pas de gestion RSS native. Il faut ouvrir le fichier XML qui s’affiche en mode code (ou alors installer Feedly ou « Extension Abonnement RSS »)
L’extension Firefox Sage permet de classer 40 flux, de les lire dans un interface graphique particulière, de les exporter vers un autre outil, de les sauvegarder.
* Sage pour Firefox apparaît soit par le menu Modules complémentaires puis Sage, soit grâce à une icône en forme de feuille située à gauche de la barre d’adresse. Il se présente sous la forme d’un panneau latéral. Après installation, des flux sont déjà présents.
Tutoriel de François Magnan1/ icônes pour mettre à jour les flux, les« capturer »2/ la liste des flux présents dans Sage3/ Comme j’ai cliqué sur le flux Sports News headline, le navigateur permet d’accéder à l’ensemble des informations du flux (textes et images) avec une mise en forme facilitant la lecture4/ Permet d’accéder aux informations unes par unes, c’est-à-dire page web par page web, mais dans leur mise en forme initiale 5/ Pour remplacer les flux présents par ses propres flux : clic droit, puis choisir l’option supprimer.
Rendez-vous http://www.lemonde.fr/rss/ et clic sur la loupe de Sage qui permet de « capturer » les flux RSS présents. Plusieurs flux sont détectés automatiquement.1/ Sélectionnez celui qui vous intéresse ( j’ai choisi le flux Economie)2/ clic sur le bouton « Ajouter le flux »Un clic sur l’icône en forme de double-flèche met à jour les flux non visités. Il est possible de créer des dossiers et sous dossiers pour classer ses flux.
* Personnalisation : * Capter des flux Facebook, Twitter* Générer un flux RSS sur les informations mises en
favoris
* Ergonomie de lecture :* Rechercher des flux sur le web* Ranger ses flux dans des dossiers* Publier une nouvelle sur Twitter, Facebook* Prévisualiser le site web d’un flux
* Traiter des flux RSS pour les fusionner* Générer des flux RSS
Site de référence pour l’utilisation professionnelle de Yahoo Pipes, le blog Bibliothèques [reloaded] d’Etienne Cavalié, conservateur à la BU de Nice, contient une liste de tutoriel vidéo par fonction permettant notamment de :
* comprendre l’interface :la barre d’outil à gauche, les fonctions Debugg, Clone, View * fusionner plusieurs flux : tronquer, dédoublonner, * fluxtrer l’affichage de résultats sur un mot : la fonction filtre (par ex. sur Calanda)
* FeedBurner est un service gratuit de gestion d'abonnement à un flux RSS offert par Google. Le service fonctionne encore mais n’évoluera plus en 2014.
* Création d’alertes : permet à un internaute de s'abonner à un flux pour le recevoir par courrier électronique. L'internaute peut aussi se désabonner du flux. Pour la fréquence des envois, FeedBurner prend deux paramètres en compte : le nombre d'éléments nouveaux du flux et le temps entre deux messages électroniques.
* Création de statistiques sur l'activité d'un flux : il faut indiquer le lien du flux RSS à FeedBurner puis lui proposer comme URL de flux l'URL générée précédemment (On réalise une boucle en proposant à Feedburner un flux RSS Feedburner). À chaque fois qu'un internaute lit le flux RSS, il est compté dans vos statistiques FeedBurner.
* Pour le mode d’emploi, consulter le tutoriel - Utiliser feedburner pour la diffusion de ses flux rss
Produit français commercialisé par Dassault Systèmes, Netvibes est un générateur de portail web personnalisable
* Il permet la création de sites web personnel privé et/ou public (les Dashboard) sous forme d’onglets contenant des mini-lecteurs de flux repositionnables par glisser-déposer
* Il agrège le contenu en provenance d'autres sites en s'appuyant sur les standards RSS, Atom et iCal (calendrier et agenda)
* Des modules spécialisés ont été développés pour augmenter l'intégration de sites populaires (Gmail, del.icio.us, flickr, Myspace, facebook, etc.)
* On peut ajouter des modules pré-programmés (météo, compte mail POP, favoris)
Il évolue vers une fonction d’analyse des données avec MisoData qui permet de :
Créer automatiquement un sur une thématique à partir d’un mot-clé
Transformer des rapports Excel en graphiques sur un seul Dashboard
Comparer les données fournis en Bigdata avec les tendances du marché
IV. Veiller Faire sa veille avec des flux RSS ?
*Un exemple de veille avec des flux RSS : l’AURG
*Générer un flux RSS à partir d’une page web
*La mort des flux RSS
*Un exemple de veille avec des flux RSS :
l’AURG
Le centre de documentation de l'Agence d'Urbanisme de la Région Grenobloise (AURG) a mis en place en 2010 un processus de veille par flux RSS sur les projets et études qui peuvent intéresser les chargés de mission de l’agence.
* Sélection des sources à surveiller : Près de 70 sources (presse nationale, presse locale, sites internet)
* Choix d’outils pour trier et sélectionner l’information : l’agrégateur de flux Newsgator, qui permet de mixer les flux puis de générer de nouveaux flux thématiques qui sont lus dans un portail Netvibes sécurisé.
*Générer un flux RSS à partir d’une
page web
Si on ne dispose pas de flux RSS sur une page qu’on souhaite surveiller, il est possible de générer un flux RSS en utilisant des outils de génération de flux RSS comme Page2RSS.com, Rsspect, Feed43, Feedity, Feedyes, mais aussi Yahoo Pipes, ou TaDaweb outils plus complexes mais aussi plus puissants.
Il est aussi possible de surveiller une page web à l’aide d’un service d’alertes personnalisées.* Un outil de surveillance de pages web UpdateScanner (plugin firefox) * Un service en ligne comme Diphur : http://www.diphur.com
Diphur
La valeur ajoutée de ce service réside en fait dans la surveillance des pages Web de manière assez fine :
La gestion des fréquences de surveillance et d’alerte (d’une heure jusqu’à un mois)
Le pourcentage de changement dans la page surveillée déclenchant l’alerte
La gestion des requêtes, mots clefs ou expressions qu’il est important d’avoir dans le texte pour être alerté, ce qui permet de limiter le bruit.
Update scanner
Permet le suivi de la mise à jour des pages Web. Pratique pour les sites ne proposant ni flux Atom ni flux RSS. Après avoir Installer Update Scanner :
Faire un clic droit sur une page et sélectionner « Vérifier les mises à jour de la page… »
Choisir à quelle fréquence les modifications seront vérifiées Quand une modification a été détectée, un message
d'avertissement apparaît dans le bandeau du bas de Firefox Cliquer sur l'icône de l'extension (flèche bleue, présente en
bas de fenêtre) afin d'ouvrir le panneau latéral d'Update Scanner
Les noms des pages Web ayant changé y sont mis en caractères gras
* Article de Cécile Arènes - Liber, libri, m. : livre http://liber-libri.blogspot.fr/2011/07/les-flux-rss-un-flop-technologique.html
* Article de Silvae –Bibliobsession sur la fin de Google Reader http://www.bibliobsession.net/2013/04/02/la-veille-a-travers-les-jardins-fermes-du-web
* Désaffection à relativiser : certes, la consultation de flux RSS génériques par le grand public est en baisse. Mais la gestion fine des flux dans Yahoo Pipes combinée à l’intégration d’information issues des réseaux sociaux peut permettre la construction d’un portail de veille très spécialisé, sous Netvibes par exemple.