LABORATOIRE I3M SOUTENANCE D’HDR La recherche d’information sur Internet au prisme de la théorie des facettes Eric Boutin Eric Boutin le 9 Octobre 2008
Jan 03, 2016
LABORATOIRE I3M
SOUTENANCE D’HDR
La recherche d’information sur
Internet au prisme de la théorie des facettes
Eric BoutinEric Boutin
le 9 Octobre 2008
LABORATOIRE I3M
2/20
Plan de l’exposé
I- La recherche d’information sur Internet au prisme de la théorie des facettes– Contexte– Théorie des facettes– Méthode expérimentale– Résultats
II- Projet de recherche– Ancrage en SIC & transversalité– Étude et utilisation des réseaux– Méthodologie
LABORATOIRE I3M
3/20
Une démarche intuitive à l’origine de mon objet d’étude
Exposé pourla maîtresse
AttaquesInformationnelles
Handicap Dossier de veille …
…différentes attentes
Une même requête…
LABORATOIRE I3M
4/20
Intégration d’indicateurs au prototype
Facetmap
Lisibilité
Accessibilité
Polarité
Subjectivité
…
Indicateurs
LABORATOIRE I3M
5/20 Problématique :Proposer un indicateur de pertinence
centré sur l’utilisateur
Google :
• Une vision unique & globale du monde
Web
Objectif :
• plusieurs vues du monde• … selon le contexte
WEB
LABORATOIRE I3M
6/20
Classifications : hiérarchique / à facettes
Exemple : code désignant les maladies virales du riz
633 189 8
633 = céréales
633.18 = riz
633.189 = maladies du riz
633.189.8 = maladies du riz d’origine virale
« Pigeon hole » Ranganathan - 1924
(DDC)
LABORATOIRE I3M
7/20
EJ = agriculture : facette principale381 = riz : facette Personnalité421 = maladie virale : facette Matière5 = éradication : facette Énergie
EJ,381;421:5
Classifications : hiérarchique / à facettes
Chaque objet est décrit par 5 facettes :- P : personnalité- M : matière- E : énergie- S : espace- T : temps
Démonstration de legos à l’origine de la théorie des facettes en 1924 D’après Garfield (1984)
(Colon)
Exemple : code désignant les maladies virales du riz
LABORATOIRE I3M
8/20
Méthodologie
Richesse lexicaleNombre de syllabes par motNombre de mots par phrase
Balise textuelle par imageContrastes entre couleurs
Polarité des termes
Rôle des pronoms personnels (je)Marques de ponctuation (!)Nombre d’adjectifs par phraseVerbe au conditionnelAdresse URL du site
Marqueurscandidats outils
dico
Dico de valence
Dép
. d
e p
sych
olog
ieU
niv.
Cat
ho.
de
Lo
uvai
n U
nive
rsité
Des
cart
es
FOUILLE DE DONNEES TEXTUELLES
TextPipe ProWebPipe Pro
Dicooccurrences
LIN
GU
IST
IQU
E
CO
MP
UT
AT
ION
NE
LLE
PS
YC
HO
LOG
IE A
PP
LIQ
UE
E
Lisibilité
Accessibilité
Polarité
Subjectivité
Indicateurs
LABORATOIRE I3M
9/20
Méthode expérimentale : exemple polarité
Corpus de pages
Pagesconsensuelles
Test de ConcordanceDe Kappa
Aspiration de pages webWebPipe Pro
Dictionnairelangue
DictionnaireDe valence
négative
négative neutre
neutre
positive
positive
Qualification automatique
Qu
alif
icat
ion
hu
mai
ne
LABORATOIRE I3M
10/20
Résultats par facette
Lisibilité Accessibilité Polarité Subjectivité
Pages consensuelles
80 % … 80 % 61 %
Concordance
Humain / Machine
66 % … 65 % 85 %
LABORATOIRE I3M
11/20
Positionnement de ce travail
• Ancrage en SIC et transversalité– S’adapter pour survivre– Avoir des logiques transversales
• Étude et utilisation des réseaux– Comprendre et traiter les réseaux– Travailler en réseau
• Méthodologie– Utiliser une méthodologie de constitution d’état de l’art– Effectuer une veille scientifique efficace
LABORATOIRE I3M
12/20
La fragmentation des savoirs
Temps
Quantité d’information disponible
Importance des logiques transversales
D’après Swanson - 1986
LABORATOIRE I3M
13/20
Logiques transversales de ce mémoire
HDR
Documentation
Science duwebLinguistique computationnelle
Psychologie
Application àla recherched’information
Médecinepsychologie
Usage desTIC
Test de Kappa
Théorie des facettes
Valence, s
ubjectivit
é, lisib
ilité, a
ccess
ibilité
LABORATOIRE I3M
14/20
Logiques transversales de mon cursus
1995-1997 1998-2000 2001-2003 2007-2008
INFORMATION
COMMUNICATION
PSYCHO ;SOCIOLINGUISTIQUE ; GESTION
Sémiologie CultureThéorie de l’Engagement
Sociologie GestionLinguistiquePsychologie
Information / Communication Théorie des organisations
cursus
714
7 5 9
2004-2006
6 5
7
LABORATOIRE I3M
15/20
Logiques transversales des doctorants co-encadrés
2001 2002 2003 2004 2005 2006 2007 2008
IntelligenceEconomique et TerritorialeAnalyse réseau
Découverte deconnaissances
Médiatisation
Pedro
Jean Pierre
Franck Philippe
Jean Do
Roberto
Eve
Sciences du web
Guillaume
2009 2010 2011
Pei
Natacha
Mohamed
Stéphane
Hajer, Maher, DangHanene
C
CCCC
C Thèse en cotutelle
LABORATOIRE I3M
16/20
Réseau des collaborations depuis 1999
A : laboratoire Crrm ou doctorants de Luc Quoniam
B laboratoire I3M site de Toulon + Gallezot
C 2 chercheurs du Loria
D Chercheurs de l’Université de Commerce du Vietnam
E école normale de Shanghai
EricBoutin
Sociopro
doctorant
MCF ou PR
Légende
45 collaborations
LABORATOIRE I3M
17/20
Découverte de connaissances dans le domaine médical
Élaboration d’un booster de pertinence de moteur de recherche
Étude du Web public en région PACA
Prise en compte de facteurs colorimétriques dans l’indicateur de pertinence des moteurs de recherche
Détermination automatique de la polarité de pages web sur le web chinois
2000-2004
2005
2006
2008
2005-2007
Contrats de recherche
LABORATOIRE I3M
18/20
Construction de l’état de l’art : méthode
Liste de réponses-1-2-3-4-5-6-7-8-9-10-…-N
disjoint
Ma biblio-5-8-9-3-66-44-2-57
Interactions = collaboration, citation, concept commun
LABORATOIRE I3M
19/20
Vers une veille scientifique
Analyse decitation
Analyse réseau
Indicateur de centralité
Front de recherche
Baseintellectuelle
LABORATOIRE I3M
20/20
Limites, prolongements … perspectives
• Limites :– Caractère réducteur des facettes– Limite de l’interface
• Prolongements :– Académiques : publications scientifiques– Valorisation industrielle
• Perspectives de recherche :– D’autres chantiers dans le domaine des sciences du web– Collaborations internationales en Asie et au Maghreb