15 mars 2008 Isabelle Escolin-Contensou Séminaire Mich el Bernard 1 Les outils de cartographie de l’Internet littéraire
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 1
Les outils de cartographie de l’Internet littéraire
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 2
1 Pourquoi faire appel à la cartographie ?
« Stratégie interdisciplinaire qui relie les gens et les lieux, les données et les organisations, les environnements réels et virtuels »
Technologie intellectuelle ancienne de la carte comme mémoire et représentation appliquée à de nouveaux espaces
• P.Levy “les modifications des cartes du savoir, leur usage, sinon même du concept de cartographie deviennent un des problèmes cruciaux de la société en gestation”
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 3
Donner à voir par la carte, construire le sens
Découverte et appropriation d’un domaine en voie de constitution, l’Internet Littéraire
Traduction symbolique, présentation visuelle de la complexité (et contrôle) : Internet comme réseau d’informations et d’interactions exemples d’application dans d’autres domaines : représentation des acteurs d’une controverse et de leurs relations, analyse de campagnes présidentielles
Les apports du numérique : Augmentation et transformation technique des
principales fonctions cognitives humaines : la mémoire, l'imagination, le raisonnement, la perception et la création
Augmentation des techniques individuelles et collectives
-> nouveaux outils de cartographie
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 4
Habiter l’Internet?
• Matrix ou le rêve des années 90 : Roy Ascott développe la conception d’une réalité virtuelle dans laquelle agir, tandis qu’on cherche à mesurer Internet
• « cartographier la complexité des espaces existants pour en comprendre les nouvelles modalités et à s'attaquer à notre relation à la modernité : browser art, soft art et net art »– Immersion/vision spectaculaire (œuvres de
Chatonsky, Benayoun)• Un cyberspace comme un territoire dont on peut se
faire une image /un espace de désorientation ?
• Construire une représentation mentale provisoire
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 5
Acteurs institutionnels opérant dans la description d’Internet
• BNF : dépôt légal et archivage du web (depuis 2002). – Collecte systématique (critère de notoriété) et thématique. – Outils de capture et d'archivage.– Distinction Toile et bibliothèque : une bibliothèque est composée
d'objets décrits de manière structurée. La collection est organisée et construite. Les notices sont riches par leur structure et au niveau du détail : quelles notices pour Internet? Quelle organisation pour l’accès aux données ?
• Consortium International pour la préservation d’Internet ( IIPC)• World Wide Web Consortium avec le développement de langages de
métadonnées pour organiser le web sémantique• The Internet Archive
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 6
Data mining sur Internet, un secteur d’innovation
• Limites techniques? intellectuelles? On doit traiter de manière quantitative et qualitative des données surabondantes : des milliards d'octets en renouvellement. – Besoin de trouver l'information dans un ensemble trop grand
(plusieurs pages de résultats) et qui manque de pertinence (“irrelevant search result »)
– Constat que « les listes ordonnées ne sont plus suffisantes pour restituer les proximités et les corrélations entre des masses d'informations de plus en plus importantes »
• Essor de la cartographie comme outil de veille économique et stratégique – Manipuler des données = récupérer, filtrer, visualiser, exporter
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 7
Développement des usages sociaux d’Internet
Communautés departage de contenus et mise en relation
Communautés departage de contenus et mise en relation
Géolocalisation des lecteurs en ligne
Géolocalisation des lecteurs en ligne
Le blog comme dispositif d’animation d’une communauté en ligne et hors ligne
Le blog comme dispositif d’animation d’une communauté en ligne et hors ligne
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 8
Social mining : « Friend Of A Friend »
• Développement de communautés à interface graphique comme lieu de rencontre et avatar. Monde simulé qui devient aussi persistant que le monde réel.
exemple : poésie sonore, interprètes, blogueurs, écrivains sur Myspace
• Cartographier un réseau social– application de cartographie (« visualisation
interactive ») développée par Patrick Barry sur LiveJournal, (voir également Touchgraph sur faceboook) : vers la transparence des interactions et des comportements en ligne
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 9
« Avec ceci, vous devriez aussi aimer cela »
• Moteurs de recherche relationnels qui s’appuient sur la popularité, la co-occurrence et la recommandation: Amaznode fladdict
• Résultats non satisfaisants : proximités peu justifiables
http://www.literature-map.com/
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 10
A qui ces outils sont-ils destinés?
• Chercheurs dotés de l’expertise scientifique, d’équipements informatiques
• Développeurs• Acteurs économiques • Utilisateurs avertis, webmasters• Etudiants• Le grand public
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 11
2 Développement des « Digital humanities »
• Visualiser dans Pajek les relations entre les personnages de la fiction sur le modèle d’un réseau social
• Analyser une bibliographie avec Touchgraph sur Amazone (en anglais seulement) en s’appuyant sur
les pages reliées
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 12
Des travaux pionniers dans l’étude de l’Internet littéraire
• E. Broudoux : Nestor et les outils de visualisation de la lecture de l’hypertexte
• S. Bouchardon, F Ghitalla: l’hypothèse d’un Internet littéraire co-construit par les acteurs validée avec Tougraph et Pajek . Carte en ligne interactive réalisée en 2004
• X. Malbreil : Touchgraph comme élément d’analyse pour le contexte de l’œuvre en ligne
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 13
Représenter le parcours : Ecran Total avec Nestor
Le parcours de la navigation hypertextuelle compose une version propre à chaque lecteur que Nestor visualise sous forme de graphe et mémorise.
Le parcours de la navigation hypertextuelle compose une version propre à chaque lecteur que Nestor visualise sous forme de graphe et mémorise.
La table des pages indique les fragments et signale ceux déjà parcourus
La table des pages indique les fragments et signale ceux déjà parcourus
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 14
L’appropriation des outils
• Succès d’applications qui permettent de visualiser le code source d’un site sous forme d’un graphe
Websites as graphs
Bleu : lienRouge : table Vert : divisionViolet: image Jaune: formulaireOrange: saut de ligne et citationNoir : racine du codeGris : autres
Bleu : lienRouge : table Vert : divisionViolet: image Jaune: formulaireOrange: saut de ligne et citationNoir : racine du codeGris : autres
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 15
Etes-vous dans les nuages?
Représentation de destags sous forme de
nuages de mots : taille selon la fréquence, ordre
alphabétiquenuages interactifs
Succès et diffusion de cette représentationPrésentation synthétique du contenu des blogs, des listes de favoris, de documents textuels
Requête sur « Lettres »
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 16
Chercher l’exactitude de la représentation du
territoire
• Mais : algorithme secret de Google, on ne sait pas comment est calculé le pagerank
• Course au référencement• Web invisible ou peu
accessible
Extrait de la cartographie blogarchique réalisée par Ch. Druaux
Sélection de la liste des blogs fondée sur le nombre de commentaires et le
rythme de parution
Sélection de la liste des blogs fondée sur le nombre de commentaires et le
rythme de parution
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 17
Silobreaker vous tient au courant
• Analyse des tendances à travers l’agrégration de milliers de flux de contenus édités par les internautes
• Représentation graphique du réseau social (personnes, institutions, entreprises…)
• Valable seulement sur des termes très fréquents à l’échelle du Web
Chronologie du succès du lecteur d’Ebook Kindle
Chronologie du succès du lecteur d’Ebook Kindle
Les relations de Jonathan Littell
Les relations de Jonathan Littell
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 18
Existe-t-il des alternatives à Google?
• Plus de 85 % des requêtes • Présentation des (trop nombreux) résultats
sous forme de liste– Fonctions de recherche avancées et commandes
spécifiques méconnues :• « Link: » , in url », « in anchor »
• Développement d’interfaces de visualisation des résultats sous forme de graphe, de cartes– Modalités d’accompagnement de l’internaute dans
son exploration • Ajustements successifs, personnalisation
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 19
Kartoo : une vision sémantique et un moteur graphique dès 2001
• Kartoo trie les résultats sous forme d'une carte reliant entre eux les concepts voisins de la thématique de recherche. Le résultat est affiché en flash ou en html. Sur activation, le lien qui relie deux sites affiche des mots clés. Recherche itérative à partir des résultats.
• 2002 version multilingue. • 2003 développement des
fonctionnalités de personnalisation et de veille.
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 20
Grokker
Carte interactive
Carte interactive
Interrogation par date, mot clé, domaine, sources
Interrogation par date, mot clé, domaine, sources
Exportation des résultats dans différents formats, et vers bibliographies
Exportation des résultats dans différents formats, et vers bibliographies
Affichage détaillé
Affichage détaillé
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 21
Quintura, métamoteur graphique
Moteur de recherche basé sur yahoo XML. Visualisation sous forme de nuage de mots navigable et détail des résultats.
Moteur de recherche basé sur yahoo XML. Visualisation sous forme de nuage de mots navigable et détail des résultats. Résultats exportablesRésultats exportables
Itération des requêtes par ajout ou suppression d’un mot clé
Itération des requêtes par ajout ou suppression d’un mot clé
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 22
3 Exercices d’application et évaluations
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 23
Jusqu’où aller dans l’instrumentation scientifique pour valider des hypothèses?
• A priori/ a posteriori• pour servir à l’étude de l’Internet
littéraire • comme territoire, champ structuré par des pôles;
trajectoires d’acteurs :• contexte d’un site, d’une page : focus, zoom
avant et arrière• l’exploration d’un œuvre en ligne, la visualisation
de la navigation • la diffusion d’un mouvement
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 24
Navigation par clusters E-critures.org, un site collectif au prisme de Clusty
Résultats limités et représentatifs
Affichage par catégories
Itération des requêtes
Résultats limités et représentatifs
Affichage par catégories
Itération des requêtes
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 25
La concurrence entre "poésie cinétique" et "poésie hypertexte" vue par Clusty
1/L'expression « poésie hypertexte » n'est pas distinguée de « poésie, hypertexte ». Affichage de 8 résultats seulement, (dont la page du centre d'où est partie la discussion entre Glazier et Jim Andrews) ; liens cassés ; des sites institutionnels qui reprennent la description proposée par les auteurs et la création de la catégorie2/ Pour “poésie cinétique”, on trouve de plus nombreuses réponses (53), une dispersion internationale (Italie : festival), associée à une revue qui se mêle d'“hactivisme” (sic) , sur la page d'un site de bookmarks social et des liens avec des oeuvres théoriques (Balpe, Malbreil) dont certaines éditées (Lavoisier en ligne, manuscrit.com)-> Clusty permet un accès rapide aux information clés. La sélection donne une image à jour de la querelle littéraire
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 26
Un mouvement qui peine à se faire connaître : le moteur All Plus confirme le statut du technoromantisme
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 27
Esquisser le paysage de la poésie électronique avec Webcrawler
1/ Requête à partir de 6 auteurs présents au festival e-poetry 2007 “xavier malbreil” 27 “patrick burgaud” 64 “philippe bootz” 61 ”“philippe castellin” 28 “philippe boisnard”69 résultats limités et représentatifs
2/ Requête avec “avant-garde” et “littérature numérique ” : sur-représentation :- de la critique par rapport aux oeuvres, et des laboratoires universitaires, - de Ph.Bootz par ses relations avec USA, le festival e-poetry, le CIAC, la revue Docks pour l'aspect international, et par ses relations avec Paragraphe, Paris 3, Cergy, Olats, le ministère de la culture pour l’aspect institutionnel.
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 28
La poésie sonore au prisme de Quintura
• Exploration large (Myspace, base de données Rhizome…), peu de bruit, affichage rapide . En quelques minutes, on obtient le contexte d'un terme avec une exploration riche. Aussi bien parce que les résultats sont multilingues (ex : avec Cybertexte, résultats en français/ anglais/ allemand/arabe) que fouillés (groupes de discussions, documents publiés sur des sites institutionnels) Gain de temps précieux en première étape de recherche et pour affiner les requêtes.
• Test avec poésie sonore : parmi 187000 pages, fait ressortir des mots clés et sélectionne des noms pionniers : Henri Chopin (sur Ubuweb, YouTube)
– Met en évidence l’historicité de la question des technologies de l'enregistreent de la parole, la rupture avec la poésie littéraire, l'implication du corps dans la production de la parole, la performance
– Distinction poésie sonore/ poésies sonores : nombreuses références sur Myspace, assurant de la diffusion large du terme
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 29
Explorer la réception d’un manifeste avec Touchgraph
Affichage sous forme de liste ou de graphe
Affichage sous forme de liste ou de graphe
Identification rapide par icônes et couleur
Identification rapide par icônes et couleur
Affichage détaillé à la demande
Affichage détaillé à la demande
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 30
Représenter les acteurs de la diffusion du Sublime technologique
Exploration et sélection avec Navicrawler puis traduction en graphe avec Pajek
Mise en évidence de l’extension et des relais de diffusion de la notion développée par Mario Costa
Le Sublime technologique selon Pajek
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 31
Cartographie de site
La page d’accueil du site du Desordre.net
La page d’accueil du site du Desordre.net
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 32
Explorer les liens à l’intérieur de Tentative d’épuisement de tentative d’épuisement de Ph de Jonkheere
bleu: liens rouge: tables vert: divisionviolet: images jaune : formes, entréeorange: sauts de ligne et citationsblack: code htmlgris : autres balises
bleu: liens rouge: tables vert: divisionviolet: images jaune : formes, entréeorange: sauts de ligne et citationsblack: code htmlgris : autres balises
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 33
Navicrawler pour explorer les liens d’Hyperfictions de JP Balpe
• Un système de renvois internes entre des blogs en miroir disséminés sur plusieurs plateformes
– Proximité du monde des jeux, des mangas, de la musique
– Proximité des outils de développement– Peu ou pas de liens avec des blogs hors
fiction, même si l’œuvre est souvent citée
• Navicrawler autorise les reprises, indique si une page a déjà été visitée. Le corpus peut être délimité a posteriori
• Visualisation avec Pajek
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 34
Conclusion
• Des outils qui viennent en appui de l’analyse
• Valider les résultats n’est possible que si on comprend le fonctionnement des outils
• Interdisciplinarité/spécialisation• L’interprétation : pas le fait d’un unique
Commentator mais co-construction et mise en relation
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 35
Références
• Roy Ascott : Moistmedia, technoetics and the three VRs ISEA 2000, actes en ligne http://www.erba-valence.fr/modules/documents/isea00/isea00_tout.htm
• Evelyne Broudoux, Outils informatiques d’écriture et de lecture, Actes du colloque Ecritures en ligne, Pratiques et communautées, Rennes 2002 . Actes en ligne www.arald.org/pdf/dossiersenligne/Actes_2_collo_ecritures_def2.pdf
• Vladimir Batagelj, Andrej Mrvar,Program for Analysis and Visualisation of Large Network, Manuel de référence pour Pajek, 2008 www.cs.duke.edu/csed/harambeenet/board07/apps/pajek/pajekman.pdf
• Evelyne Broudoux, Oriane Deseiligny, Frank Ghitalla; sous la direction de Serge Bouchardon : Un laboratoire de littératures : littérature numérique et Internet. BPI, 2007
• Serge Bouchardon, Carte Littérature numérique, en ligne http://www.utc.fr/~bouchard/bpi/cartographie/crawl-bpi.swf
• Gilles Deleuze and Felix Guatarri Mille plateaux. (1980). Paris: Minuit. • E. Desmontils, C. Jacquin : Annotations sur le Web : notes de lecture
http://www.lalic.paris4.sorbonne.fr/stic/octobre/programme0209.html• Franck Ghitalla, Alain Le Berre, Matthieu Renault, Des documents, des liens et des acteurs,
Conférence H2PTM, 2005 http://www.webatlas.fr/?page=Publications• Mathieu Jacomy, Documentation Navicrawler, http://www.webatlas.fr/index.php?
page=Documentation• Lucia Leao New Labyrinths and Maps: the Challenge of Cyberspace's Art. http://www.isea2000.com/• Xavier Malbreil, Pour une méthodologie d’approche critique des œuvres de littérature
informatique, RILUNE, Juillet 2006 http://www.rilune.org/mono5/articlesnumerique.htm
15 mars 2008 Isabelle Escolin-Contensou Séminaire Michel Bernard 36
Liens vers les outils cités
• Moteurs de recherche avec affichage sous forme de carte et de graphe– Kartoo www.kartoo.com– Grokker www.grokker.com– Touchgraph http://www.touchgraph.com/TGGoogleBrowser.html et http://www.touchgraph.com/TGAmazonBrowser.html
• Clusterisation– Clusty http://clusty.com/– All Plus http://www.allplus.com/– Quintura, http://www.quintura.com/ extension de Firefox
• Exploration des réseaux sociaux – Silobreaker http://www.silobreaker.com/– http://patrickbarry.com/projects/ljnet/index.php
• Visualisation du parcours de lecture : – Nestor http://www.gate.cnrs.fr/~zeiliger/nestor/nestor.htm– Navicrawler, extension de Firefox http://www.web-mining.fr/navicrawler
• Création et visualisation de graphePajek http://pajek.imfm.si/doku.php