Top Banner
1
20

Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Jul 13, 2015

Download

Education

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

1  

Page 2: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

L’Université   libre   de   Bruxelles   a   fêté   ce8e   année   ses   180   ans.   Elle   est   située   sur  différents  campus  et  sites  à  Bruxelles  mais  également  en  Wallonie  ;  ce  qui  peut  avoir    un  impact  sur  l’adresse  insFtuFonnelle  employée  par  les  chercheurs.    

Lors   de   sa   créaFon,   l’ULB   rassemblait   à   la   fois   les   étudiants   francophones   et  néerlandophones.  Mais  dans  les  années  60,  la  Belgique  connut  une  crise  linguisFque  importante   qui   mena   à   la   scission   de   l’université   et   à   la   créaFon   de   la   Vrije  Universiteit   Brussels   (VUB)   néerlandophone.   Il   arrive   fréquemment   que   des  chercheurs   traduisent   leur   adresse   insFtuFonnelle   par   «   Free   universi2es   of  Brussels   »   rendant  quasiment   impossible   la   disFncFon  entre   les   publicaFons  de   la  VUB  et  de  l’ULB.  

2  

Page 3: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Le  dépôt  insFtuFonnel  de  l’ULB,  appelé  DI-­‐fusion,  a  été  mis  en  place  en  septembre  2009.  Ses  missions  sont  les  suivantes  :  

•  Me8re  en  valeur  la  producFon  scienFfique  de  l'Université  ;  

•  Augmenter  la  visibilité,  l'accessibilité  et  l'impact  de  la  recherche  effectuée  à  l'ULB  ;  

•  Assurer  le  référencement  des  publicaFons  et  travaux  scienFfiques  de  l'ULB  à  fins  d'évaluaFon,  de  classement,  etc  ;    

•  Assurer  l'archivage  des  publicaFons  et  travaux  scienFfiques  de  l'Université.    

3  

Page 4: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Quelle  est  la  plus-­‐value  de  l’encodage  dans  DI-­‐fusion  pour  le  chercheur  ?  

è Il  peut  générer  très  rapidement  une  liste  de  publicaFons  complète  en  format  PDF.  

N.B.   :  Les  chercheurs  de   l’ULB  sont  fortement  encouragés  à  encoder  dans   le  dépôt  mais  rien  ne  les  y  oblige  véritablement  sauf  s’ils  désirent  postuler  à  un  autre  posiFon  à   l’ULB  ou  demander  une  bourse  de   recherche  au  Fonds  NaFonal  de   la  Recherche  ScienFfique.  Dans  ce  cas,  pour  que  leur  candidature  soit  prise  en  compte,  leur  liste  de  publicaFons  doit  être  Frée  de  DI-­‐fusion.  

 

4  

Page 5: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Autre  exemple  de  plus-­‐value  pour  les  chercheurs  :  

è  l’alimentaFon  automaFque  de  leur  page  personnelle  sur  le  site  de  l’université.  Un  clic  sur  «  Voir  toutes  les  publica2ons  »  mène  vers  la  liste  complète  des  publicaFons  du  chercheur  en  quesFon  dans  DI-­‐fusion.  

5  

Page 6: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

DI-­‐fusion,  qui  s’appuie  sur  plusieurs  logiciels  libres  comme  VuFind  et  Dspace,  compte  138.700   références   dont   16%   disposent   du   texte   complet.   Les   noFces  bibliographiques   sont   accessibles   à   tout   internaute.   Des   restricFons   d’accès   sont  placées   au   niveau   des   textes   complets   déposés   par   les   chercheurs.   Les   textes  complets   peuvent   être   en   accès   libre   (7%),   en   accès   restreint   à   la   communauté  universitaire  ou  en  accès  privé.  

Un  peFt  personnage  à   la  droite  d’un  nom  d’auteur  signifie  que  ce8e  personne  est  (ou  a  été)  un  membre  de  l’ULB.  Un  clic  sur  ce  personnage  permet  de  générer  la  liste  des  publicaFons  de  ce  chercheur  au  format  PDF,  par  exemple.    

 

6  

Page 7: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

L’interface   d’encodage   n’est   accessible   qu’aux   membres   de   l’ULB.   32   types   de  documents   différents   peuvent   être   encodés.   L’encodage   s’effectue   soit  manuellement,   soit   à   l’aide   de   foncFonnalités   d’import   semi-­‐automaFque.   Dans  ce8e  présentaFon,  nous  nous  concentrerons  sur  l’import  à  parFr  de  Scopus.  

7  

Page 8: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

L’import   des   références   ne   s’effectue   pas   directement   entre   Scopus   et   DI-­‐fusion  mais   passe   par   un   réservoir   intermédiaire.   Dans   un   premier   temps,   nous   nous  intéresserons  sur  l’alimentaFon  de  ce  dernier  (flèche  rouge).    

Le   réservoir   intermédiaire   compte   54.425   références.   Il   a   été   alimenté   pour   la  première   fois   en   2010   à   l’aide   de   plusieurs   DVDs   fournis   par   Elsevier.   Depuis,   un  script   mensuel   y   ajoute   les   nouvelles   références   indexées   par   Scopus   le   mois  précédent.   Les   références   importées   dans   ce   réservoir   conFennent   au  moins   une  des  43  affiliaFons  principales  correspondant  à  l’ULB.    

8  

Page 9: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Voici   une  parFe  des   43   affiliaFons  principales   correspondant   à   l’ULB   et   idenFfiées  dans   Scopus.   Comme  on  peut   le   voir,   il   existe  des  doublons   (même   inFtulé,  AF-­‐ID  différent)   qui   nécessiterait   un   ne8oyage   (certainement   une   fusion).   Le   «   Free  universi2es   of   Brussels   »   est   également   présent   bien   qu’il   ramène   avec   lui   des  publicaFons   de   la   VUB.   Pour   ce   dernier,   un   ne8oyage  manuel,   noFce   par   noFce,  devra  certainement  être  effectué  afin  d’idenFfier  les  publicaFons  de  l’ULB.  

Parmi   ces   43   affiliaFons,   se   trouvent   également   celles   des   hôpitaux   associés   pour  lesquels  la  présence  de  doublons  est  également  observable.  

 

 

9  

Page 10: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

La   liste   des   43   affiliaFons   principales   étant   relaFvement   incomplète,   nous   avons  procédé   il   y   a   quelques   mois   à   des   analyses   complémentaires   afin   d’idenFfier  d’autres  affiliaFons.  Pour  ce  faire,  nous  avons  lancé  des  requêtes  sur  des  termes  ou  expressions  suscepFbles  de  se  trouver  dans  l’adresse  insFtuFonnelle  uFlisée  par  un  chercheur  de   l’ULB,  mais  étant  suffisamment  discriminant(e)s.  Nous  avons  bien  sûr  écarté   les   publicaFons   où   apparaissait   une   des   affiliaFons   précédemment  idenFfiées.   À   chaque   fois   qu’une   nouvelle   affiliaFon   correspondant   à   l’ULB     était  trouvée,  son  AF-­‐ID  était  ajouté  à  la  liste  des  AND  NOT  dans  les  requêtes  ultérieures.  

Ces   recherches   nous   fournissent   une   liste   de   publicaFons   dont   les   noFces   sont  présentées   de   la   manière   suivante.   À   parFr   de   ce8e   interface,   il   est   impossible  d’idenFfier   l’inFtulé  et   l’AF-­‐ID  qui  se  cachent  derrière  «  b  Ecole  de  Santé  Publique,  …  »  dans  l’exemple  proposé.  

10  

Page 11: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Pour  idenFfier  le  nom  des  affiliaFons  (ici,  «  Ecole  de  Santé  Publique  »)  et  leur  AF-­‐ID  (ici,  encadré  en  rouge),  nous  avons  exploité  une  des  APIs  fournies  par  Elsevier.  Celle  uFlisée   ici   permet   de   visualiser   le   code   XML   d’une   noFce   à   parFr   du   numéro  d’idenFfiant  de  la  publicaFon  (eid).    

11  

Page 12: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Nous   nous   intéressons   à   présent   à   l’import   de   références   contenues   dans   le  réservoir   vers   DI-­‐fusion   (flèche   rouge).   Sur   les   54.425   références   du   réservoir,  environ  21.000  ont  été  importées  dans  DI-­‐fusion.  

 

 

12  

Page 13: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Deux  types  d’import  sont  possibles  :  1.  l’import  semi-­‐manuel  effectué  par  le  chercheur  lorsqu’il  clique  sur  «  Importer  de  Scopus  »  sur  l’écran  d’encodage.  Il  arrive  alors  sur  cet  écran  où  il  introduit  le  nom  de  l’auteur   souhaité.   Le   système   lui   indique   les   résultats   en   précisant   le   nombre   de  publicaFons  présentes  dans  le  réservoir  qui  y  correspondent.  En  cliquant  sur  le  nom  d’un   auteur,   les   noFces   des   publicaFons   qui   lui   sont   associées   apparaissent  (illustraFon   de   droite).   Avant   leur   validaFon,   le   chercheur   peut   procéder   à   des  modificaFons.    2.   l’import  automaFsé  n’est  possible  que  pour   les  références  dont  tous   les  auteurs  ont   déjà   été   validés   ou   peuvent   l’être   automaFquement.   Parmi   celles-­‐ci,   sont  suspendues   les   références   dont   le   type   de   document   menFonné   dans   Scopus   ne  correspond   à   aucun   type   de   document   disponible   dans   DI-­‐fusion.   L’import  automaFsé  a  tourné  le  16  juin  2014  et  a  permis  d’importer  environ  7.000  références.  Très  prochainement,  cet  import  sera  effectué  de  manière  régulière.  

13  

Page 14: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

La  gesFon  des  auteurs  est  primordiale  pour  effectuer  des  imports  automaFsés.  Dans  Scopus,   une   forme   d’un   auteur   correspond   à   un   ScopusID.   Il   arrive   relaFvement  souvent  qu’un  auteur  dans  la  vraie  vie  soit  associé  à  de  mulFples  ScopusID.  C’est  le  cas  de  ce  chercheur  de  l’ULB.  Afin  d’améliorer  sa  représentaFvité  dans  le  système,  il  serait   opportun   que   ce   chercheur   procède   à   la   fusion   des   ScopusID   qui   lui  correspondent.  Une  demande  de   fusion   peut   être   aisément   adressée   à   Scopus   en  sélecFonnant  les  profils  concernés  et  en  cliquant  sur  «  Request  to  merge  authors  ».  Nous   esFmons   que   ce   «   ne8oyage   »   devrait   être   effectué   par   le   chercheur   lui-­‐même   ;   lui   seul   étant   capable   de   déterminer   avec   cerFtude   si   un   profil   lui  correspond  ou  non.      

 

14  

Page 15: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Il  arrive  également  fréquemment  qu’un  ScopusID  d’auteur  soit  lié  à  un  main  auteur  (dont  la  noFce  comprend  généralement  un  prénom  complet).  Dans  ce  cas,  la  fusion  d’auteurs  avec  le  main  auteur  est  fréquente.    

C’est  le  cas  de  l’exemple  proposé,  preuves  étant  que  :  •  Une  recherche  à  Ruyschaert  J-­‐M  ne  ramène  que  cet  unique  résultat  ;  

•  La  noFce  renseigne  un  nombre  important  de  variantes  du  nom  (à  droite).  

 

15  

Page 16: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Dans   DI-­‐fusion,   nous   essayons   au   maximum   qu’un   auteur   dans   la   vraie   vie  corresponde   à   un   auteur   dans   DI-­‐fusion   associé   à   un   seul   idenFfiant   (tableau   de  droite).  

L’import   d’une   référence   de   Scopus   implique   que   la   table   de   mapping   conFenne  l’authorID  de   Scopus  associé   à  un  authorID  ULB.   S’il   n’y   a  pas  de   correspondance,  une  validaFon  automaFque  des  auteurs  est  possible  si  un  certain  nombre  de  règles  est   respecté,   comme   par   exemple   :   si   le   ScopusID   n’a   pas   encore   été   validé,   et  l’affiliaFon  de  l’auteur  est  l’une  des  43  et  il  n’existe  qu’un  auteur  ULB  dans  DI-­‐fusion  de   même   nom   et   iniFale   du   prénom,   alors   le   mapping   de   cet   auteur   est  automaFquement  effectué.  

Il  existe  également  une  sorte  de  fichier  «  an2-­‐mapping  »  avec  les  auteurs  dont  nous  sommes  sûrs  qu’ils  n’apparFennent  pas  ou  n’ont  pas  appartenu  à   l’ULB.  Et   lors  de  l’import,  ce8e  liste  est  également  consultée.    

 

16  

Page 17: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Comme  indiqué  dans  la  règle  de  validaFon,  nous  nous  basions  au  départ  sur  le  nom  et   l’iniFale   du   prénom,   le   plus   souvent   renseignés   dans   l’XML   des   références  importées,   mais   nous   nous   sommes   rendu   compte   que   nous   avions   mappé   des  personnes   différentes   (même   inFale   mais   prénom   différent).   Pour   améliorer   le  mapping  et  éviter  ce  genre  d’erreurs,  nous  uFlisons  à  présent  le  REST  API  lorsque  les  prénoms  des  auteurs  dans   l’XML  des  publicaFons  ne   comprennent  qu’une   iniFale.  Ce8e  API  permet,  à  parFr  du  authorID,  de  consulter  la  noFce  complète  de  l’auteur  et  de  connaître  son  prénom  complet.  

 

 

17  

Page 18: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Nous  envisageons  de  travailler  très  prochainement  :  •  À   la   réa8ribuFon  d’AF-­‐ID  à  des   auteurs  qui   n’en  ont  pas  ou  pour   lesquels   celui  

menFonné   est   erroné.   Ce8e   réa8ribuFon   s’effectue   noFce   par   noFce   et   les  demandes  de  correcFons  sont  adressées  à  Elsevier  via  un  formulaire  en  ligne  ;  

•  Au  ne8oyage  des  profils  d’affiliaFon  (via  la  fusion  d’AF-­‐ID)  ;  

•  Au   ne8oyage   des   profils   d’auteur   (par   demande   de   fusion,   comme  précédemment   illustré)  même  si  nous  esFmons  que   ce   travail   serait  plus  précis  s’il  était  effectué  par  le  chercheur  lui-­‐même  ;  

•  À  l’amélioraFon  du  mapping  des  types  de  documents  afin  de  diminuer  le  nombre  de  noFces  suspendues  ;  

•  À  la  pré-­‐validaFon  manuelle  des  auteurs  ;  

•  À   l’import   direct   de   Scopus   dans   DI-­‐fusion   via   notre   résolveur   de   lien   (cf.   dia  suivante).  

18  

Page 19: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

Le   réservoir   étant   relaFvement   incomplet   (en   effet,   il   ne   conFent   pas   toutes   les  publicaFons   de   l’ULB,   ni   celles   publiées   par   un   auteur   ULB   avant   qu’il   ne   soit  membre  de  l’université*),  nous  avons  développé  un  import  direct  à  parFr  de  Scopus  noFce  par  noFce  qui  sera  très  prochainement  opéraFonnel  (encadré  rouge).      

*Ces   publicaFons   doivent   également   être   dans   le   dépôt   insFtuFonnel   afin   de  pouvoir  générer  la  liste  complète  des  publicaFons  d’un  chercheur.  

19  

Page 20: Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB

20