Archiver le web social Quelles méthodes pour quels objectifs ? Session « Nouveaux objets archivistiques identifiés » Antoine Courtin - Institut national d’histoire de l’art #AAFTroyes2016 mercredi 30 mars 2016
Archiver le web socialQuelles méthodes pour quels objectifs ?Session « Nouveaux objets archivistiques identifiés »
Antoine Courtin - Institut national d’histoire de l’art
#AAFTroyes2016 mercredi 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Abstract*
Nous évoquerons le web social sous le prisme des réseaux sociaux pour
lequel, la question des archives, est devenu au fil du temps un enjeux, à la fois pour les sociétés éditrices mais aussi pour les collectivités qui les utilisent.
Ainsi de la TimeCapsule réalisée par Twitter pour archiver les tweets de la #MuseumWeek au grand projet de la LOC (Library of Congress) ou
d’InternetArchives, cette brève intervention évoquera les initiatives à différentes échelles en abordant les enjeux techniques, épistémologiques et éthiques afin
de voir dans ces archives, un nouveau cas d’école pour les archivistes mais également un nouvel object de recherche dans de multiples disciplines.
*Mots-clés/orientations*Réseaux sociaux numériques
Outils de collecte
Recherche
Etat de l’art
Projets en cours
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
© 2014 by LyonLabs, LLC and Barrett Lyon.
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Elaborer des stratégies pour la collecte de contenu (communication officielle de l’institution + communication crowdsourcée des communautés d’intérêt)
Connaitre les autres projets de collecte pour les autres organismes (cohérence/coopération)
Evaluer les implications juridiques et éthique de l’archivage de contenu des médias sociaux
Développer une compréhension de l’utilisation actuelle et des potentiels du contenu des réseaux sociaux
Développer les modes de communications/rendus et les techniques d’enrichissements et de description
Connaître les enjeux et les implications techniques de ce type de collecte
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Le web 2.0 offrent cette possibilité de trouver,
organiser, partager ou créer de l’information d’une
manière à la fois personnelle, mais globalement accessible.Coutant Alexandre, Stenger Thomas, « Processus identitaire et ordre de l'interaction sur les réseaux socionumériques. », Les Enjeux de l'information et de la communication 1/2010 (Volume 2010) , p. 45-64
Lorsque vous utilisez un de nos services, vous consentez à la récupération, le transfert, la manipulation, le stockage, la divulgation entre autres utilisations de vos informations
comme décrit dans cette politique de confidentialitéTwitter, Politique de confidentialité, (2011)
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
accroissement du volume des informations
apparition/disparition constante des plateformes de RSN
diversité des formats et mode d’accès aux données
mise à jour et agrégation continues des informations
Fréquence des captures, méthode et traitement des contenus +
accessibilité des corpus et valorisation
*Challenges*
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
juillet 2006Lancement de Twitter
Octobre 2009Partenariat avec Google pour un flux en temps réel (jusqu’en juillet 2011)
Août 2015Nouveau partenariat avec Google (intégration temps réel dans les SERP sur mobile et postes fixes)
Ventes d’accès (et de ses données) via la société Datasift et GNIP
Septembre 2015
juillet 2014L a n c e m e n t d e analytics.twitter.com
Avril 2012Possibilité de télécharger une « archive » de ses tweets
Twitter devient le seul interlocuteur pour accéder à son FireHose
*Twitter et ses data*
Février 2013Twitter donne accès à la totalité de son archives par son interface de recherche
14 avril 2010Twitter reverse à
la Library of Congress, 5 TO
Fév. 2012
Restriction de l’API
Avril 2014Rachat de la société Gnip
1er tests des @UkNatArchives
pour l’archivage des tweets de comptes gouvernementaux
2008
mai. 2009Première version de l’API
2013Depuis 2006, le volume de tweets archivés par la LOC est estimé à 170 milliards
Sept. 2012
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://goo.gl/wyIdxt
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Elections Européennes - Collecte du web électoral par la #BnF
0
125
250
375
500
2009 2014
Compte Twitter Pages Facebook Nombre URL Total
Elections régionales - Collecte du web électoral par la #BnF
0
750
1500
2250
3000
2010 2015
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://goo.gl/qMNcbA
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Archives-it*
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://dash.harvard.edu/bitstream/handle/1/25658314/HL_web_archiving_env_scan_2006.pdf?sequence=1
*L’exemple du Smithsonian*
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://goo.gl/VlfUzL
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
https://archive.org/details/twitterstream&tab=collection
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://data.issy.com/explore/dataset/flux-rss-du-twitter-issylesmoul/export/?sort=published&disjunctive.published&disjunctive.author
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://politwoops.sunlightfoundation.com/
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Implications juridiques et éthiques*
[…] the ethical challenge concentrate on a larger question: juste because we can archive social media, does that mean we should ? […]
Twitter permet aux utilisateurs de déposer des demandes de retraits pour les personnes utilisants du contenu sans attribution
Droits des utilisateurs / droits de propriété intellectuelle
La question de la vie privée et/ou du consentement des utilisateurs
Nécessité pour l’archiviste de documenter l’ensemble de leurs actions et de décision.
Rivers CM and Lewis BL (2014) Ethical research standards in a world of big data [v1; ref status: approved with reservations 1, http://f1000r.es/2wq] F1000Research 2014, 3:38 (doi: 10.12688/f1000research.3-38.v1)
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
*Tools*
https://github.com/edsu/twarc
http://140dev.com/free-twitter-api-source-code-library/
https://github.com/digitalmethodsinitiative/dmi-tcat
https://tags.hawksey.info/get-tags/
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
A pre-configured collection of tools
including Social Feed Manager and Lentil for
easily building Twitter and Instagram social media archives on your own
computer.
https://github.com/NCSU-Libraries/Social-Media-Combine
SocialMedia- Archives -ToolKit Environmental Scan
https://www.lib.ncsu.edu/social-media-archives-toolkit/collecting/social-media-harvesting-toolshttp://social-feed-manager.readthedocs.org/en/m5_004/
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://digital.wustl.edu/ferguson/
http://goo.gl/M33QOs
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
"Documenting the Now: Supporting Scholarly Use and Preservation of Social Media Content" project.
http://goo.gl/Z9fc2p
• Projet lancé en janvier 2016
• 3 institutions partenaires
• Université du Maryland
• Université Saint-Louis de Washingtion
• Université Riverside de Californie
• Financé par la Fondation Andrew W. Mellon
(à hauteur de 517000$ pour 2 ans)
• Développement d’un outil DocNow
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://histnum.hypotheses.org/category/ww1
https://goo.gl/3va0rC
*Objet de recherche*
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
http://goo.gl/G6tC0Y
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
• Bibliographie sélective sur le dépôt légal de l’internet, Bibliothèque national de France (http://
www.bnf.fr/documents/bibliographie_dl_web.pdf)
• Web90 – Patrimoine, Mémoires et Histoire du Web dans les années 1990 (https://
web90.hypotheses.org/693)
• Web Archiving Environmental Scan, Harvard Library Report, January 2016 (https://goo.gl/
es2NDO)
• National Archives and Records Administration (White Paper on Best Practices for the Capture of
Social Media Records) http://goo.gl/d0sjSw
• @IanMiligan
• @ruebot
• @edsu
*Ressources*
• @valerie_schafer
• @inadlweb
• @HistWebArchives
IIPC Web Archiving Conference 2016, Reykjavík, Iceland 13-15 April, 2016Sans oublier, la séance « Social Media Archiving »
• @DLWebBnF
• @AndreaGoethals
• @was3210
Archiver le web social: quelles méthodes pour quels objectifs ? #AAFTroyes2016 - 30 mars 2016
Merci ! #AAFTroyes2016@seeksanusername